Đối thoại với AI: Generative AI (AI tạo sinh) và những điều cần biết
Trí tuệ nhân tạo Tạo sinh (Generative AI) đang là một chủ đề nóng trong ngành AI hiện nay.
Vậy nó là gì và bạn cần biết những gì về nó? Hãy cùng tìm hiểu qua cuộc trò chuyện giữa mình và trợ lý AI Claude dưới đây nhé
Người: Bạn có thể giải thích về Trí tuệ nhân tạo Tạo Generative AI sinh cho trẻ 10 tuổi hiểu được không?
Trợ lý AI: Được rồi, đây là cách tôi sẽ giải thích về trí tuệ nhân tạo tạo sinh cho trẻ 10 tuổi:
Trí tuệ nhân tạo tạo sinh là một loại AI có khả năng tự tạo ra những thứ mới mẻ, chẳng hạn như viết truyện hoặc vẽ tranh. Nó giống như cho máy tính sức tưởng tượng vậy!
Máy tính sử dụng công nghệ gọi là học máy, trong đó nó nghiên cứu rất nhiều ví dụ về một thứ gì đó, ví dụ như truyện hay tác phẩm nghệ thuật, để học cách chúng được tạo ra. Sau đó, nó có thể sử dụng những gì đã học được để tạo ra các ví dụ hoàn toàn mới mà trông có vẻ do con người làm ra.
Một số ví dụ về những gì AI tạo sinh có thể tạo ra bao gồm:
Những câu chuyện hay bài thơ mới, thậm chí theo nhiều thể loại hay phong cách khác nhau
Những hình ảnh mới về bất cứ thứ gì - con người, động vật, vật thể, thậm chí cả sinh vật huyền bí
Những video hay hoạt ảnh mới
Âm nhạc và bài hát
Các chương trình và mã máy tính
Nói tóm lại, AI tạo sinh là máy tính có trí tưởng tượng, có thể tạo ra nhiều thứ mới mẻ sau khi nghiên cứu các ví dụ thực tế do con người tạo ra. Đây vẫn là công nghệ mới nhưng nó ngày càng hoàn thiện hơn! Bạn có hiểu AI tạo sinh là gì không? Hãy cho tôi biết nếu bạn có câu hỏi nào nhé!
Người: Thế prompts là gì?
Trợ lý AI: Câu hỏi hay! Prompts là một phần quan trọng trong cách hoạt động của AI tạo sinh.
Prompt là một đoạn text người dùng nhập vào để cho AI biết họ muốn nó tạo ra loại nội dung gì. Nó giống như cung cấp các ý tưởng hay nguồn cảm hứng ban đầu cho AI. Một số ví dụ:
Nếu bạn muốn AI tạo ra một câu chuyện, prompt của bạn có thể là "Hãy viết một câu chuyện giả tưởng ngắn về một cô gái phát hiện ra một sinh vật ma thuật."
Nếu bạn muốn nó tạo ra một hình ảnh, prompt có thể là "Một bức tranh sơn dầu về một con kỳ lân trong rừng."
Đối với một bài hát, bạn có thể nhập "Một bài hát dân gian vui vẻ có guitar và piano."
AI sau đó sẽ sử dụng prompt để bắt đầu tạo ra thứ gì đó mới. Prompt càng chi tiết thì AI càng hiểu rõ bạn muốn nó tạo ra cái gì.
Prompt giúp hướng dẫn AI và đưa ra các ràng buộc để những gì nó tạo ra có ý nghĩa. Nếu không có prompt tốt, output có thể ngẫu nhiên hoặc vô nghĩa. Prompt giúp bạn điều khiển sự sáng tạo của AI!
Bạn có hiểu prompts là gì rồi không? Cho tôi biết nếu bạn còn thắc mắc gì nhé!
Người: Làm thế nào để giỏi viết prompt?
Trợ lý AI: Đây là một số mẹo để viết prompt tốt cho AI tạo sinh:
Cụ thể - Cung cấp nhiều chi tiết có thể cho AI. Thay vì "một câu chuyện về một cô gái", hãy viết "một câu chuyện giả tưởng về một cô gái 12 tuổi có thể nói chuyện với rồng."
Sử dụng ngôn ngữ sinh động - Chọn các từ mô tả chi tiết để tạo ra hình ảnh. Ví dụ: "một bức tranh tĩnh vật sống động với những loại trái cây nhiệt đới trong một giỏ mộc."
Đặt ngữ điệu - Sử dụng các từ để thể hiện tâm trạng bạn muốn cho nội dung được tạo ra. Ví dụ: "một bài hát pop vui vẻ với lời lạc quan."
Đưa ra bối cảnh - Chi tiết về địa điểm, thời kỳ, thể loại, v.v. giúp hướng dẫn AI. Ví dụ: "một câu chuyện kiểu viễn tưởng cyberpunk lấy bối cảnh ở Tokyo năm 2150."
Tránh mơ hồ - Hãy nêu rõ bạn muốn gì. Đừng để cho nhiều cách hiểu.
Kích thích sự sáng tạo - Những prompt độc đáo kích thích trí tưởng tượng của AI. Ví dụ: "một công thức cho một hương vị kem mới lấy cảm hứng từ cực quang."
Kiểm tra prompt trước khi tạo - Đảm bảo prompt cụ thể, rõ ràng và hấp dẫn trước khi nhấn nút tạo.
Thử nhiều prompt khác nhau - Thí nghiệm để xem prompt nào cho kết quả tốt nhất.
Học hỏi từ kinh nghiệm - Điều chỉnh prompt trong tương lai dựa trên những gì hoạt động tốt và chưa tốt.
Càng thực hành viết prompt, bạn sẽ càng giỏi trong việc hướng dẫn AI tạo ra ý tưởng bạn muốn! Cho tôi biết nếu bạn cần thêm mẹo viết prompt nhé.
Người: Làm thế nào để áp dụng viết prompt để kiếm tiền?
Trợ lý AI: Dưới đây là một số ý tưởng để kiếm tiền với prompt AI tạo sinh:
Viết nội dung freelance - Cung cấp dịch vụ viết prompt riêng cho khách hàng để tạo ra nội dung như bài viết, truyện, mô tả sản phẩm, v.v. theo nhu cầu của họ.
Bán nội dung được tạo ra - Sử dụng prompt để tạo ra các sản phẩm như ebook, thơ, slogan và bán nội dung trên các sàn thương mại điện tử.
Marketing mạng xã hội - Cung cấp dịch vụ tạo ra prompt để tạo ra các bài đăng, caption, hashtag trên mạng xã hội cho các thương hiệu.
Tư vấn AI - Cung cấp dịch vụ tư vấn cho doanh nghiệp về cách tận dụng AI tạo sinh, cách viết prompt hiệu quả.
Thiết kế prompt - Thiết kế các bộ prompt xoay quanh các chủ đề đặc thù để bán hoặc cấp phép cho người tạo nội dung.
Chào bán ý tưởng - Sử dụng prompt để viết các ý tưởng hoặc kịch bản và chào bán cho các nhà xuất bản/phim ảnh.
Thu thập prompt từ cộng đồng - Thu thập prompt từ cộng đồng để biên tập thành sách hoặc công cụ prompt bán.
Prompt NFT - Bán các bộ prompt giới hạn dưới dạng NFT để người mua có thể dùng tạo nội dung độc đáo.
Đăng ký nhận prompt - Cung cấp gói prompt hàng tháng để người dùng đăng ký nhận để tạo nội dung.
Chủ đề podcast - Tạo ra các prompt podcast xoay quanh các xu hướng để bán hoặc chào các host.
Chìa khóa là sử dụng prompt một cách sáng tạo để cung cấp giá trị cho người khác thông qua việc tạo nội dung, nguồn cảm hứng, v.v.! Cho tôi biết nếu bạn cần ý tưởng kiếm tiền từ prompt nhé.
Người: Những lựa chọn thay thế cho Claude AI để sử dụng AI Tạo sinh là gì?
Trợ lý AI: Dưới đây là một số lựa chọn thay thế cho Claude AI để truy cập AI tạo sinh:
Anthropic - Đơn vị tạo ra Claude. Cung cấp Claude thông qua danh sách chờ/đăng ký trả phí.
OpenAI API - Cung cấp quyền truy cập các mô hình GPT-3 và DALL-E thông qua API trả phí.
Cohere - Các mô hình AI dùng để tạo văn bản thông qua API trả phí.
InferKit - Các mô hình AI tạo sinh dùng để tạo nội dung văn bản. Có gói miễn phí và trả phí.
Rytr - Trợ lý AI viết nội dung quảng cáo và nội dung tiếp thị. Có gói miễn phí và trả phí.
ShortlyAI - API tạo văn bản có gói miễn phí và đăng ký trả phí.
Sudowrite - Trợ lý viết AI thông qua tiện ích mở rộng trình duyệt Chrome. Có phiên bản miễn phí.
Writesonic - Công cụ viết nội dung AI với thử miễn phí và đăng ký trả phí.
Quillbot - Công cụ cải biên văn bản làm đơn giản hóa và mở rộng văn bản. Có gói miễn phí và trả phí.
Elephas - Thư viện mã nguồn mở Python để truy cập các mô hình tạo văn bản miễn phí.
Giá cả và khả năng của các dịch vụ này khác nhau, vì vậy nên khảo sát để tìm nền tảng phù hợp nhất với nhu cầu và ngân sách của bạn
Người: BERT là viết tắt của từ gì?
Trợ lý AI: BERT là viết tắt của Bidirectional Encoder Representations from Transformers.
Một cách chi tiết hơn:
BERT là mô hình xử lý ngôn ngữ tự nhiên phổ biến do Google phát triển vào năm 2018.
Nó sử dụng kiến trúc Transformer, dựa trên cơ chế chú ý và rất hiệu quả cho dữ liệu tuần tự như văn bản.
Từ "Bidirectional" ám chỉ BERT phân tích văn bản theo cả hai chiều tiến và lùi trong quá trình tiền huấn luyện. Điều này cho phép nó học đại diện ngữ cảnh tốt hơn.
"Encoder" có nghĩa BERT mã hóa văn bản thành các vector biểu diễn. Nó không tạo ra văn bản mà chỉ phân tích văn bản.
"Representations" ám chỉ cách BERT biểu diễn ý nghĩa của văn bản trong không gian vector toán học.
Tên đầy đủ cho biết BERT học các biểu diễn song hướng sâu của văn bản bằng cách sử dụng bộ mã hóa Transformer trong quá trình tiền huấn luyện.
BERT dựa trên các mô hình trước đó như ELMo và ULMFit cũng phân tích văn bản theo hai chiều.
Nhưng BERT đã đưa tiền huấn luyện hai chiều lên một tầm cao mới, cải thiện đáng kể hiệu suất trên các nhiệm vụ NLP như trả lời câu hỏi, phân tích cảm xúc, v.v.
Như vậy, tên BERT tóm tắt các khả năng chính của nó là mô hình Transformer hai chiều để mã hóa văn bản thành các biểu diễn hữu ích cho các nhiệm vụ NLP hạ nguồn. BERT đã trở thành một trong những mô hình NLP phổ biến và mạnh mẽ nhất trong những năm gần đây.
Người: Về tài nguyên tính toán, cần bao nhiêu tiền để huấn luyện một mô hình như ChatGPT-3?
Trợ lý AI: Huấn luyện một ngôn ngữ mô hình lớn như ChatGPT-3 đòi hỏi nguồn tính toán khổng lồ và có thể tốn hàng triệu đô la. Dưới đây là ước tính sơ bộ:
Chi phí tính toán: Chi phí ước tính để huấn luyện mô hình GPT-3 175 tỷ tham số của OpenAI là hơn 4,6 triệu đô la. Đây chỉ là chi phí cho các nguồn tính toán đám mây như GPU/TPU cần thiết trong quá trình huấn luyện.
Chi phí dữ liệu: Việc cấp phép và xử lý các tập dữ liệu văn bản khổng lồ có thể thêm vài triệu đô la nữa. Ví dụ, tập dữ liệu WebText 300GB được sử dụng cho GPT-3 được cho là đã tốn 4,6 triệu đô la để mua và xử lý.
Nhân công: Lương của hàng chục kỹ sư và nhà nghiên cứu học máy làm việc trong nhiều tháng cũng phải được tính vào. Con số này dễ dàng lên tới hàng triệu đô.
Hệ thống: Các hệ thống huấn luyện phân tán quy mô lớn, phần mềm và cơ sở hạ tầng thêm chi phí. Mạng và lưu trữ tốc độ cao cho các tập dữ liệu khổng lồ rất tốn kém.
Phần cứng: Một số công ty như Anthropic mua phần cứng tùy chỉnh riêng để huấn luyện, đòi hỏi chi phí đầu tư vào các trung tâm dữ liệu. Nhưng hầu hết vẫn dựa nhiều vào các nền tảng đám mây.
Chi phí phụ trội: Các khoản phụ phí như văn phòng, điện, băng thông, v.v. có thể lên tới hàng trăm ngàn đô mỗi năm.
Tổng cộng, chi phí để huấn luyện một mô hình như GPT-3 có thể dễ dàng vượt 10 triệu đô khi tính tất cả các khoản chi phí!
Chỉ có các công ty công nghệ lớn và các phòng thí nghiệm AI có nguồn tài trợ lớn mới đủ khả năng phát triển các mô hình AI khổng lồ như ChatGPT-3. Chi phí tính toán đã vượt quá khả năng của hầu hết các tổ chức và cá nhân. Đòi hỏi phải bỏ ra chi phí “khủng” để chơi ở quy mô AI này!
Người: Mô hình tiền huấn luyện (pre-trained model) là gì?
Trợ lý AI: Mô hình tiền huấn luyện (pre-trained model) là các mô hình học máy đã được huấn luyện trước trên các tập dữ liệu lớn bởi người khác, và sau đó có thể được sử dụng trong các dự án của bạn bằng cách tinh chỉnh lại trên dữ liệu mới. Dưới đây là một số điểm chính về mô hình tiền huấn luyện:
Chúng tiết kiệm thời gian và tài nguyên cho bạn vì quá trình huấn luyện ban đầu đã được thực hiện. Bạn không cần thu thập và gán nhãn tập dữ liệu huấn luyện khổng lồ của riêng mình.
Các ví dụ phổ biến bao gồm mô hình như GPT-3 cho tạo văn bản và DALL-E cho tạo ảnh. Các mô hình này được huấn luyện bởi các công ty như OpenAI và Anthropic trên các tập dữ liệu rất lớn.
Bạn có thể tải xuống các mô hình mã nguồn mở đã được tiền huấn luyện như BERT (cho NLP) và ResNet (cho thị giác máy tính) và tùy biến chúng cho nhu cầu của mình.
Tinh chỉnh liên quan đến việc lấy mô hình đã tiền huấn luyện và huấn luyện thêm một chút trên dữ liệu cụ thể của bạn để thích ứng nó. Điều này nhanh hơn nhiều so với huấn luyện hoàn toàn từ đầu.
Mô hình tiền huấn luyện có thể là mục đích chung hoặc nhắm vào các lĩnh vực cụ thể như y tế, tài chính, v.v. Hãy chọn mô hình khởi đầu phù hợp.
Lợi ích bao gồm đạt hiệu suất cấp độ state-of-the-art mà không cần bỏ công sức nặng nề. Nhược điểm là ít khả năng tùy biến và phụ thuộc vào công việc bên ngoài.
Bạn vẫn cần chuyên môn ML để sử dụng đúng cách các mô hình tiền huấn luyện. Nó không hoàn toàn là plug-and-play.
Tóm lại, tận dụng các mô hình đã được tiền huấn luyện có thể mang lại lợi thế lớn khi phát triển các giải pháp AI có khả năng. Đây là kỹ thuật phổ biến ngày nay. Nhưng bạn vẫn cần kỹ năng để tinh chỉnh và tích hợp chúng vào các ứng dụng đầy đủ.
Người: Tệp dữ liệu đầu ra của mô hình đã được tiền huấn luyện là gì? Nó có đuôi mở rộng file nào không? Trung bình nó có dung lượng bao nhiêu gigabyte?
Trợ lý AI: Dưới đây là một số chi tiết về các tệp mô hình đã được tiền huấn luyện:
Định dạng tệp: Các mô hình tiền huấn luyện thường được lưu dưới định dạng như .pb của TensorFlow hoặc .pt hoặc .pth của PyTorch. Đây là những tệp nhị phân tối ưu hóa chứa tất cả các tham số và trọng số mô hình.
Kích thước tệp: Các tệp có thể có kích thước từ vài chục megabyte cho các mô hình nhỏ đến vài gigabyte cho các mô hình học sâu rất lớn. Ước tính trung bình, nhiều mô hình tiền huấn luyện phổ biến có kích thước từ 100MB đến 1GB.
Ví dụ, mô hình BERT cơ bản có kích thước khoảng 440MB. Mô hình BERT lớn hơn là 1,3GB.
Kích thước các mô hình GPT-3 của OpenAI dao động từ 125MB (Ada) đến 175B (Davinci). Các mô hình lớn nhất không có công khai.
Các mô hình thị giác máy tính cũng thay đổi về kích thước. ResNet-50 khoảng 100MB trong khi ResNet-152 là 230MB.
Tệp chứa kiến trúc mạng nơ-ron đầy đủ và tất cả các trọng số và độ lệch đã học được từ việc huấn luyện trên các tập dữ liệu lớn. Điều này cho phép suy luận trên dữ liệu mới.
Càng lớn tập dữ liệu huấn luyện và mô hình phức tạp hơn thì kích thước tệp lưu trữ tất cả các thông tin đó càng lớn.
Các kỹ thuật nén như lượng tử hóa, tỉa cành, chưng cất, v.v. có thể giảm kích thước tệp mà không làm mất đi nhiều độ chính xác.
Như vậy, các mô hình học sâu đã được tiền huấn luyện thường có kích thước từ 100MB đến vài GB, tùy thuộc vào độ phức tạp của mô hình. Các tệp chứa mô hình đã được huấn luyện đầy đủ ở dạng nhị phân tối ưu sẵn sàng để triển khai.
Người: Tôi còn thiếu khái niệm nào mà chưa hỏi bạn?
Trợ lý AI: Dưới đây là một số khái niệm quan trọng liên quan đến AI tạo sinh mà chúng ta chưa thảo luận chi tiết:
Mạng đối sinh (GANs) - Kiến trúc nơi hai mạng nơ-ron cạnh tranh với nhau để tạo dữ liệu mới. Một mạng tạo các ứng viên và mạng kia đánh giá chất lượng.
Học tăng cường - Kỹ thuật huấn luyện AI dựa trên việc thưởng cho các hành vi và kết quả mong muốn. Cho phép mô hình học bằng cách tương tác với môi trường.
Transformer - Kiến trúc mạng nơ-ron đặc biệt hiệu quả với dữ liệu tuần tự. Chỉ dựa hoàn toàn vào các cơ chế chú ý chứ không phải đệ quy hay tích chập.
Nhúng (Embedding) - Biểu diễn các giá trị danh mục rời rạc như từ ngữ dưới dạng vector số liên tục mã hóa ý nghĩa. Kỹ thuật quan trọng cho xử lý ngôn ngữ tự nhiên.
Học chuyển giao - Tái sử dụng các phần của mô hình đã được tiền huấn luyện cho bài toán mới bằng cách tinh chỉnh trên dữ liệu mới. Tăng tốc độ huấn luyện.
Thước đo đánh giá - Các cách để đo lường chất lượng của các mô hình tạo sinh như Điểm Inception, Khoảng cách Fréchet Inception, và đánh giá của con người.
Thiên vị và đạo đức - Các vấn đề như tiềm năng thiên vị trong dữ liệu huấn luyện, các ứng dụng có lợi của AI, và cách để các mô hình phù hợp với giá trị nhân văn.
Đa dạng - Tạo ra các output khác nhau cho cùng một prompt bằng cách nắm bắt sự mơ hồ, nhiều nghĩa, v.v.
Hãy cho tôi biết nếu bạn cần giải thích bất kỳ khái niệm nào ở trên hoặc các khái niệm liên quan khác về AI tạo sinh! Tôi rất vui lòng đi sâu hơn vào bất kỳ lĩnh vực nào bạn muốn tìm hiểu thêm.
Người: Cảm ơn bạn. Bạn có thể chuyển đoạn hội thoại này sang một bài blog bằng tiếng Việt được không?
Trợ lý: Được rồi, dưới đây là bản dịch cuộc trò chuyện này sang tiếng Việt dưới dạng một bài blog
Kết
Qua cuộc trò chuyện trên, chúng ta có thể thấy trí tuệ nhân tạo tạo sinh là một lĩnh vực phát triển vượt bậc. Nó mở ra nhiều cơ hội và tiềm năng cho cả doanh nghiệp lẫn người tiêu dùng.
Mình rất ngưỡng mộ sức mạnh và khả năng sáng tạo của công nghệ AI này. Nó giúp máy móc trở nên thông minh và linh hoạt hơn rất nhiều. Đồng thời, nó cũng giúp con người tiết kiệm thời gian và công sức cho nhiều công việc.
Tuy nhiên, cũng cần lưu ý về mặt đạo đức và an toàn khi phát triển và ứng dụng AI. Hy vọng các nhà khoa học và doanh nghiệp sẽ chú trọng phát triển AI có trách nhiệm, vì lợi ích của con người.
Mọi người hãy theo dõi blog để cập nhật thêm nhiều thông tin thú vị về trí tuệ nhân tạo nhé!