EN
VN

CÔNG TRÌNH NGHIÊN CỨU CỦA VINBRAIN ĐƯỢC VINH DANH TẠI MỘT TRONG NHỮNG HỘI NGHỊ LỚN NHẤT THẾ GIỚI VỀ XỬ LÝ TÍN HIỆU ÂM THANH

Calendar 25/07/2022

Interspeech là hội nghị toàn diện và lớn nhất thế giới về khoa học và công nghệ xử lý ngôn ngữ nói (speech recognition). Interspeech lọt top 4 hội nghị lớn nhất thế giới về xử lý tín hiệu âm thanh được thống kê đánh giá trên trang Google Scholar.  

VinBrain tự hào được công bố thành quả của nghiên cứu “An Efficient and High Fidelity Vietnamese Streaming End-to-End Speech Synthesis” (Phương pháp tổng hợp giọng nói đầu cuối truyền trực tuyến bằng tiếng Việt hiệu quả và có độ trung thực cao) tại Interspeech năm nay. Kỹ thuật trong bài báo này dã được áp dụng hiệu quả, đóng góp quan trọng cho các tính năng liên quan trong sản phẩm của VinBrain.  

  

Trọng tâm của nghiên cứu xoay quanh phương pháp truyền trực tuyến cho mô hình tổng hợp giọng nói song song như VITS để tổng hợp văn bản dài một cách hiệu quả trên CPU. Để chứng minh tính hiệu quả của phương pháp phát trực tuyến của chúng tôi trong việc tổng hợp giọng nói chất lượng cao trên CPU với độ trễ thấp, chúng tôi đo lường độ trễ khách hàng có thể nhận biết (CPL) là khoảng thời gian từ khi nhận được yêu cầu đến khi bộ đệm âm thanh đầu tiên được phát (CPL thấp hơn là tốt hơn). Khi chế độ phát trực tuyến được bật, phương pháp của chúng tôi giảm CPL 26,6 lần và 6,64 lần so với VITS ban đầu và so với khi mô hình của chúng tôi ở chế độ phát không trực tuyến. Kết quả của nghiên cứu này là tiền đề cho khả năng áp dụng lên các thiết bị có cấu hình hạn chế, mở ra cơ hội trải nghiệm thành tựu công nghệ hiện đại đồng đều cho tất cả mọi người. Đây là bước đệm hướng tới mục tiêu cải thiện cuộc sống người Việt bằng sức mạnh AI và IOT của VinBrain. 

Trước quá trình xét duyệt đề án nghiên cứu gắt gao và tỷ lệ được chấp nhận chỉ khoảng 50%, việc được lựa chọn công bố tại Interspeech 2022 có ý nghĩa lớn lao với VinBrain. Thành công bước đầu này là sự ghi nhận trên phạm vi quốc tế về nỗ lực của VinBrain trong ứng dụng AI ở lĩnh vực tổng hợp giọng nói. 

Đứng sau thành công của nghiên cứu là 2 tác giả Trần Nguyên Đức Thọ, Chu Thế Chương - nhân sự VinBrain. Qua bài báo, 2 tác giả đã đề xuất một hệ thống tổng hợp tiếng nói dựa trên mô hình VITS. Hệ thống được đề xuất cho phép xử lý song song liên tục chỉ cần phần cứng CPU computer với chất lượng âm thanh rất gần với giọng đọc của con người. Đóng góp này là một trong những cách giải quyết hiệu quả vấn đề độ trễ cao trong tổng hợp tiếng nói. Những đóng góp, nỗ lực trong nghiên cứu của nội bộ VinBrain một lần nữa được đánh giá cao trong các hội thảo Quốc tế, thể hiện sự học hỏi và tìm tòi không ngừng của các thế hệ nhân sự VinBrain vì cải tiến xã hội, cải tiến con người! 

Share:

News Related

Calendar 12/08/2022

VinBrain - Medtech solution for a better healthcare

Within the framework of the Forbes Impact Business Summit organized by Forbes Vietnam and LIN...
View More
HEALTH HACKATHON 2022 - CEO VINBRAIN VỚI CHỦ ĐỀ SỐ HÓA TRONG Y TẾ Calendar 08/08/2022

Health Hackathon 2022 - CEO VinBrain with "Digitalization in health"

At Health Hackathon 2022, CEO of VinBrain made views on "Digitalization in healthcare"
View More
Calendar 08/08/2022

VinBrain: Những bộ óc Việt và hành trình mang AI tới thế giới

Có chung đam mê với trí tuệ nhân tạo (AI), những bộ óc Việt tại...
View More
VINBRAIN - DRAID™ MANG CÔNG NGHỆ CHẨN ĐOÁN Y TẾ AI CHO HÀNG TỶ NGƯỜI Calendar 05/08/2022

DrAid™ - Công nghệ chẩn đoán y tế AI của Việt Nam có cơ hội được ứng dụng toàn cầu

Nếu vượt qua những bài kiểm tra khắt khe từ FINDDX, WHO sẽ chứng thực...
View More
FORBES 2022: VINBRAIN AND FUTURE SOLUTIONS FOR VIETNAMESE HEALTHCARE INDUSTRY Calendar 03/08/2022

Forbes 2022: VinBrain and future solutions for vietnamese healthcare industry

In August, VinBrain CEO - Mr. Truong Quoc Hung is going to be invited to...
View More
DRAID x FERRUM VÀ SỨ MỆNH GIÚP 7 TRIỆU BỆNH NHÂN Calendar 27/07/2022

DrAid™ x Ferrum with mission of helping 7M patients

Ferrum Health, the industry leader in enterprise AI solutions for global health systems, announces that...
View More

Top

Share