FIND研究員:陳蕙琪
日本正積極布局日語大型語言模型(Large Language Model, LLM)的發展。近年日本政府和企業都高度重視AI技術,投入研發資源希望在此領域取得突破性進展。根據總務省2024年版情報通信白皮書統計,目前日本民眾使用生成式AI比例有9%,與歐美相對較低,但對未來使用持正面態度。在製作及翻譯文件、查詢資料、利用AI諮詢健康及疾病資訊等潛在需求預估達7成,看好日本AI發展前景。
GPT-4 Turbo模型運算能力多4倍
為了掌握日本市場需求,全球領先的AI公司OpenAI宣布在東京設立亞洲第一個辦公據點,並推出專為日語使用者設計的GPT-4 Turbo模型。這款模型的運算能力是GPT-4的4倍,處理日語內容的速度更是3倍,可見OpenAI對日本市場的重視程度。
日本國內企業和研究機構也積極發展自有大型語言模型。日本電信電話公司(NTT)開發以日文為主的輕量級模型tsuzumi,定位為擁有專業知識的小型語言模型,已開始應用在金融、醫療等領域;Line(Line Yahoo)則推出Japanese-large-lm模型,使用LINE自己的大型日語網頁來訓練模型,為日語的開源軟體。此外,日本廣告公司Cyber Agent發行了Cyber Agent LM2-7B模型,另有發行聊天版本的CyberAgentLM2-7B-Chat,可以一次處理5萬字的日語文章。
日本學研機構積極發展大型語言模型
日本國立研究開發法人情報通信研究機構(NICT)與KDDI株式會社開始共同開發大型語言模型,NICT蒐集600億件以上的網頁資料,搭配KDDI開發的幻覺抑制技術及多模型AI技術,致力提高執行系統的信賴性。日本軟體公司Stability AI Japan推出Japanese Stable LM Alpha大型語言模型,其學習資料涵蓋日文和英文,為研究目的而創建的模型,發表後僅供研究使用。
圖1:日本主要LLM
資料來源:期待高ネペ国産生成AI(前編)──AIソ�f史的変遷シ大規模言語хЫюソ動向 | NTT技術ЖцみЮю
日本在大型語言模型市場的積極布局,展示了科技創新與本土化需求的完美結合。無論是政府的政策支持,還是企業和研究機構的技術研發,都為日本在全球AI競爭中奠定了堅實基礎。
對於台灣而言,日本的成功經驗值得借鏡。台灣可以加強政府與產業的協同合作,推動本土AI技術的研發,特別是針對在地語言及文化需求的模型開發。同時,吸引全球科技領袖來台設立研發據點,提升國際競爭力,為未來的AI技術應用鋪設堅實道路。
封面圖片來源:本文作者以AI生成
參考資料來源:
1.期待高ネペ国産生成AI(前編)──AIソ�f史的変遷シ大規模言語хЫюソ動向
2.総務省|令和6年版 情報通信白書
3.Introducing OpenAI Japan | OpenAI
4.NTT版大規模言語хЫю「tsuzumi」
5.36億еьфみУソ日本語言語хЫюメ公開ウネウギ (linecorp.com)
6.独自ソ日本語LLM(大規模言語хЫю)ソдみЖъ⑦2メ一般公開 ―32,000Ьみヱ⑦対応ソ商用利用可能スХцЧЬхЫюメ提供― | 株式会社ДユдみリみЖラ⑦Ь
7.日本語言語хЫю「Japanese StableLM Alpha」メээみЗウネウギ
8.NICTシKDDIゎ大規模言語хЫюズ関エペ共同研究メ開始|2024年|NICT-情報通信研究機構
沒有留言:
張貼留言