“Trợ lý ảo” cho lái xe của sinh viên Bách Khoa

Trợ lý ảo sẽ tự động thông báo cho lái xe biết đoạn đường nào có sự cố giao thông, tắc đường và gợi ý cung đường thuận lợi.

Nhóm Vbee gồm giảng viên và sinh viên Viện Công nghệ thông tin và Truyền thông (Đại học Bách Khoa Hà Nội) đang hoàn thiện ứng dụng Vadi “trợ lý ảo” lái xe với hai tính năng được tích hợp là bản đồ giao thông và báo nói. Ứng dụng này được cập nhật trên hệ điều hành Android hoặc iOS. Theo đó người dùng có thể tải miễn phí thông qua máy tính hoặc điện thoại thông minh.

Ứng dụng Vadi giúp lái xe biết đoạn đường phía trước sẽ gặp tín hiệu, sự cố giao thông nào.
Ứng dụng Vadi giúp lái xe biết đoạn đường phía trước sẽ gặp tín hiệu, sự cố giao thông nào.

Để tạo ra ứng dụng này, nhóm đã phát triển giải pháp hội thoại với người dùng bằng tiếng nói trên nền tảng công nghệ trí tuệ nhân tạo (AI). Với công nghệ tổng hợp tiếng nói (chuyển văn bản thành tiếng nói – Text To Speech) chất lượng cao, tự nhiên giống giọng người, Vadi mang đến cho người nghe những bài báo nói ngay tức thì mỗi khi có tin bài mới trên các báo điện tử.

Nghiên cứu thực hiện từ đầu năm nay, hướng đến người dùng là lái xe. Với họ, bản đồ và cảnh báo giao thông rất quan trọng, nhưng hiện Việt Nam chủ yếu dựa vào GPS hoặc nghe VOV để biết về tình trạng giao thông, mà chưa có cảnh báo mỗi khi có sự cố.

Theo TS Nguyễn Thị Thu Trang, thành viên nhóm nghiên cứu, sử dụng Vadi người dùng sẽ nhận được thông báo về tai nạn, tắc đường hoặc lũ lụt tại thời gian thực, từ đó đưa ra các gợi ý để lái xe chuyển cung đường khác.

Vadi còn phục vụ nhu cầu giải trí do được tích hợp công nghệ đọc báo. Ví dụ, người dùng có thể yêu cầu Vadi đọc một bài báo về trận bóng World Cup đêm qua, hoặc yêu cầu tìm đường tới một địa điểm nào đó bằng giọng nói, không cần thao tác bằng tay.

“Chúng tôi là nhóm đầu tiên ở Việt Nam tích hợp tính năng bản đồ giao thông và báo đọc trong một ứng dụng”, TS Trang nói. Riêng về giọng đọc, nhóm mất khá nhiều thời gian để tạo ra giọng có ngữ điệu thu hút và gần gũi nhất với người dùng, khác với ngôn ngữ máy đọc thông thường là đều đều, không tự nhiên.

Ứng dụng Vadi trên hệ điều hành iOS.
Ứng dụng Vadi trên hệ điều hành iOS. (Ảnh: PN).

Ứng dụng hiện có gần 5.000 người dùng. Nhóm nghiên cứu đã hoàn thiện tính năng điều khiển bằng giọng nói cho Vadi, giúp thuận tiện trong quá trình sử dụng, đặc biệt khi đang lái xe. Tương lai, ngoài cung cấp bản đồ và báo nói, nhóm sẽ cung cấp thêm các dịch vụ như sách nói, truyện nói hoặc các hình thức giải trí khác cho lái xe.

Chia sẻ về khó khăn, sinh viên Lê Văn Thắng cho biết, do liên quan đến nhiều lĩnh vực trong công nghệ bản đồ, như làm thế nào để thông báo nhanh nhất và chính xác nhất, nhóm mất rất nhiều thời gian. Có lúc gần như thức trắng đêm suốt cả tháng trời để cùng nhau giải quyết.

Nhóm cũng đã hoàn thiện tính năng cho người dùng phản hồi và phản ánh về hiện trạng giao thông. Các thông tin này sẽ được thẩm định để đưa ra thông báo chính xác và nhanh nhất tới người dùng.

Tại Việt Nam, công nghệ tổng hợp tiếng nói đang được một số doanh nghiệp ứng dụng trong các hệ thống tổng đài trả lời tự động, các hệ thống thông báo công cộng.