VinBrain tự hào được công bố Trần Nguyễn Đức Thọ và Chu Thế Chương - thuộc phòng AI - Ngôn Ngữ Tự Nhiên, Công ty VinBrain, thuộc tập đoàn Vingroup - xuất sắc được công nhận và vinh danh tại Hội nghị Inter Speech 2022 với bài báo “An Efficient and High Fidelity Vietnamese Streaming End-to-End Speech”.
Inter speech là hội nghị hàng đầu trong lĩnh vực speech recognition (nhận diện giọng nói), thuộc top 4 hội nghị lớn nhất thế giới về xử lý tín hiệu âm thanh được thống kê đánh giá trên trang Google Scholar.
Bài báo tập trung vào bài toán tổng hợp tiếng nói trực tuyến real-time (một lĩnh vực đang rất được quan tâm về cả nghiên cứu lẫn phát triển sản phẩm trong những năm gần đây). Các tác giả đã đề xuất một hệ thống tổng hợp tiếng nói dựa trên mô hình VITS (Conditional Variational Autoencoder with Adversarial Learning for End-to-end Text-to-speech). Hệ thống được đề xuất cho phép xử lý song song real-time chỉ cần phần cứng CPU computer với chất lượng âm thanh rất gần với giọng đọc của con người.
Đóng góp này là một trong những cách giải quyết hiệu quả vấn đề độ trễ cao trong tổng hợp tiếng nói. Kĩ thuật trong bài báo này đã được áp dụng hiệu quả, có tính ứng dụng cao trong nhiều sản phẩm và dịch vụ của chúng ta.
Top
Cập nhật những tin tức và thông tin mới nhất từ VinBrain bằng cách đăng ký nhận bản tin của chúng tôi!