售票機加入語音辨識 龐大資料庫及降噪為成功關鍵
臺北大眾捷運股份有限公司於3月11日在捷運中山站啟用了國內軌道界的第一座「語音售票機」,加入語音辨識以及精準的降噪技術,只要對著售票機「說」出要抵達的中、英文站名,就可以輕鬆購票。
隨著文明發展,科技的進步也不斷地加速,人工智慧技術更是普遍運用在3C產品或販賣機上,為生活帶來便利。北捷的首座語音售票機就運用了語音辨識的技術,利用「說」的方式就能輕鬆購買車票。而語音是一種類比訊號,文化大學資訊工程系教授楊泰寧表示,在做語音辨識前還須將其做訊號的轉換,再來需要蒐集龐大的資料,來訓練機器去進行文字與語言的正確判斷,才能增加準確性。
楊泰寧表示:「你要先把他轉成數位訊號,那語音是頻率,所以我們還要再經過一些轉換成頻率的動作。語音辨識主要有三個元素,第一就是機器要夠快,那這機器又分成兩種,一種是你訓練的機器跟你實做的機器,就像我們用Google的語音辨識,那它只是已經訓練好的,讓你去把它判斷說你講的話是什麼,那後面有一個訓練的機器,那訓練的機器就很大,可能是一個超級電腦。再來就是演算法,那第三就是data(數據),就是你要有一些訓練的data(數據),那當你這三隻腳都具備了,你才可以做好一套系統。」
不同於手動的售票機,語音售票機最大的功用在於,能夠在眾多選項中直接快速說出欲抵達的站名,大幅減少了操作的時間。然而語音辨識率對於機器運作來說是很重要的關鍵,語音售票機的麥克風利用降噪技術,將車站周遭的噪音降到最低,接收購票者最清楚的聲音,以達到精準的辨識率。
楊泰寧表示:「如果我這個捷運站可以到達100多個捷運站,我如果把它弄成按鈕,那100多個很麻煩對不對,還是要讓你選,那如果我能在一個相對安靜的環境下,那我直接念站名,那它從這個上百個就直接抓出那個,那是蠻方便的嘛!我不用去看,那尤其是少量的(選項),因為我只辨識那些站嘛,所以基本上出錯的機率就不大這樣。」
目前捷運語音售票機有中、英兩種語言選擇,若有需要增加多國語言的選項,楊泰寧表示必須先有足夠的資料庫,由多種聲音來訓練機器去做修正以及調整系統才能完成,雖然難度會增加且耗工時,但卻能在實質上為各國的旅客帶來更多的便利性。
以上新聞由華岡電台記者 許玉儒 採訪報導
回應文章建議規則: