正在努力載入中,請稍候

推廣台語 AI語音系統使用鄉土戲劇當語料民視台語新聞

建立時間

2025-12-10

音檔時長

00:02:50

與會者
unknow
台語 (Beta) 為測試中的新功能,暫不支援逐句/逐字時間戳記與語者資訊,實際體驗可能與其他語言有所差異。
unknow
真的是很有心。我們看到希望大家都能把臺語學得更好。這次北科大跟交通大學,研發出這一套叫做 AI 臺語語音的辨識系統。這個系統裡面,用到很多像民視的戲劇,像《親戚不計較》、《娘家》、《幸福來了》,用這個電視劇來做研究的教材。
unknow
來幫你想一個辦法。最好是能用他的土地去賣。
unknow
電視臺八點檔演員全部講臺語,不過不少年輕人聽不懂。北科大跟交通大學合作開發出一套讓人聽懂臺語的語音辨識系統。過去其實一顆都要賣一百塊的高山高麗菜,現在只賣六十塊而已。
unknow
放上臺語新聞、螢幕對應字幕,首先先建立語料庫。團隊在全臺灣找六百位民眾錄音,錄各地的臺語腔調總共三百多小時,更加與電視臺合作,透過戲劇訓練系統模型。
unknow
目前保存臺語最多的其實就是電視臺的鄉土劇。所以我們就是跟民視這邊要了很多小時的語料,那這邊應該就至少有大概一千或兩千小時的語料了,是上千的語料這樣。然後這個去 train 才有希望。
unknow
多年來推廣在地文化的民視,這次提供團隊《親戚不計較》、《娘家》、《阿不拉的三個女人》、《春花望露》跟《幸福來了》等臺語劇,總共三千小時,來做 AI 語音辨識的語料,目前系統的準確率已經有八成。
unknow
民視單純若以一個戲劇來講、一個影片來講,我們通常是有聲有影。那這個影的部分我們能夠去... 因為它有語音檔跟那個影像檔,交大它就是幫我們把這個語音的庫存... 語音的庫存,我敢說這是臺灣第一完整的資料庫啦。這次交大這讓我們能夠在老人家,他們要用... 在語音裡面,他要講話能夠把它打出來,這樣就很方便了。這我是覺得這我們能夠貢獻的地方啦。
unknow
這一次跟交大、跟北科大的合作,讓民視的這些劇作在傳統電視上面應用以外,也在這個 AI 領域裡面,找到另外一個發光發亮的地方。
unknow
我是會說臺語的機器人。
unknow
電腦也會開口說臺語,團隊更開發出另外一套系統,只要打中文就會像 Google 翻譯一樣教你念。透過四名專業的臺語老師聲音合成,目前已經有網頁版。未來更規劃要推出手機 App,希望更多臺灣人能夠輕鬆學臺語。
unknow
民視新聞臺北報導。
MIShareMIShare
00:00:00 / 00:02:50
1x
註冊 Meeting Ink,免費享每月 3 小時會議記錄逐字稿與 AI 重點摘要!
notify