Thuyết trình bằng công nghệ người ảo

Dựa trên nền tảng AI đa thể thức, avatar ảo có thể thay thế người thật thực hiện bài thuyết trình một cách sinh động.

AimeTalk, do công ty Aimesoft phát triển và ra mắt đầu tháng 9, là phần mềm người ảo hỗ trợ việc trình chiếu các slide. Theo mô tả của công ty, từ một bức ảnh khuôn mặt duy nhất, phần mềm sẽ tạo ra nhân vật ảo dưới dạng avatar có thể cử động. Nhân vật ảo sau đó tự bật chế độ trình chiếu slide, đọc nội dung, tự động chuyển trang… Avatar cũng có khả năng bật/tắt video bên trong slide, cũng như thực hiện một số chức năng khác để quá trình thuyết trình được tự động hóa hoàn toàn.

Người thuyết trình ảo được xây dựng trên nền tảng trí tuệ nhân tạo đa thể thức (Multimodal AI) của Aimesoft, kết hợp các công nghệ xử lý hình ảnh, tiếng nói, ngôn ngữ tự nhiên và tự động hoá RPA. Công nghệ AI và tổng hợp tiếng nói cũng cho phép điều chỉnh tốc độ, âm điệu và ngoại hình của người ảo.

AimeTalk có thể thuyết trình với hơn 40 thứ tiếng khác nhau, giúp người dùng thể hiện trơn tru bằng ngôn ngữ họ không thông thạo. Trên thực tế, giọng đọc của AimeTalk chưa thực sự tự nhiên và đại diện công ty cho biết công nghệ vẫn đang tiếp tục được hoàn thiện thời gian tới.

Theo Aimesoft, người thuyết trình ảo có thể thay thế người thật để thuyết trình trong các cuộc họp, bài giảng, hội thảo… Giải pháp giúp tiết kiệm thời gian và công sức khi thuyết trình cùng một nội dung nhiều lần. AimeTalk đã bắt đầu được sử dụng tại một số công ty Nhật Bản để tự động thuyết minh, hướng dẫn cách sử dụng sản phẩm.

Công nghệ người ảo được phát triển từ năm 2016 và phổ biến trong khoảng hai năm trở lại đây. Hiện công nghệ này được ứng dụng vào các lĩnh vực như người bán hàng ảo, nhân viên lễ tân ảo, người yêu ảo. Thậm chí, kỹ sư Eugenia Kuyda còn sử dụng công nghệ AI này để hồi sinh người đã khuất.

Người ảo tự động đọc slide thuyết trình về Multimodal AI

Trong khi đó, người thuyết trình ảo bắt đầu được chú ý đến trong Covid-19 do xu hướng làm việc và học tập từ xa. AimeTalk là sản phẩm đầu tiên được phát triển trong lĩnh vực tự động hóa trình chiếu tại Việt Nam.

Gần đây, công nghệ thuyết trình ảo còn tiến xa hơn với deepfake. Chẳng hạn, công ty Synthesia ở Anh đã phát triển công cụ cho phép người dùng minh họa bài thuyết trình bằng clip với sự tham gia của avatar y hệt bản thân. Quá trình tạo ra một bản sao bằng deepfake này khá đơn giản. Người dùng ngồi trước máy quay khoảng 40 phút, đọc một kịch bản chuẩn bị sẵn. Cảnh quay và âm thanh sẽ dạy thuật toán về các chuyển động trên khuôn mặt và cách phát âm của người đó để bắt chước ngoại hình và giọng nói. Sau đó, họ chỉ việc nhập những gì muốn nói và bản sao sẽ thực hiện bài thuyết trình thay họ.

Ông Nguyễn Tuấn Hưng, Chủ tịch Aimesoft, chia sẻ: “Do Covid-19, các sự kiện không thể diễn ra và nhiều doanh nghiệp, tổ chức đã linh hoạt tìm kiếm các giải pháp nhằm hạn chế tiếp xúc trực tiếp. Sự kiện trực tuyến là một trong những lựa chọn phù hợp và lúc này, người thuyết trình ảo có thể đóng vai trò hữu ích nhờ khả năng thuyết trình giống người thật và hạn chế sai sót khi trình bày”.