ChatGPTに代表される大規模言語モデルを「富岳」で、富士通など4者が開発へ
富士通をはじめ、東京工業大学、東北大学、理化学研究所の4者は、スーパーコンピューター「富岳」を活用した大規模言語モデルの分散並列学習手法の研究開発を2023年5月から実施する。大規模言語モデルは、ChatGPTをはじめとする生成AIの中核として使用されている深層学習のAIモデル。
それぞれの役割は、富士通が大規模言語モデルの高速化、東京工業大学が全体総括と大規模言語モデルの並列化および高速化、東北大学が学習用データの収集とモデルの選択、理化学研究所が大規模言語モデルの分散並列化・通信高速化と大規模言語モデルの高速化となる。
今後、研究開発の成果物を公開することで社会で幅広く使える大規模言語モデルの構築環境を整備。「GitHub」や「Hugging Face」を通じ、多くの研究者や技術者が基盤モデルの改善や新たな応用研究に参画することを促していく。また、ものづくりをはじめとする産業分野などへの応用を想定したマルチモーダル化のためのデータ生成手法や学習手法の開発を手掛ける東海国立大学機構 名古屋大学、大規模言語モデル構築のためのデータや技術を提供するサイバーエージェントとの連携も検討していく。
それぞれの役割は、富士通が大規模言語モデルの高速化、東京工業大学が全体総括と大規模言語モデルの並列化および高速化、東北大学が学習用データの収集とモデルの選択、理化学研究所が大規模言語モデルの分散並列化・通信高速化と大規模言語モデルの高速化となる。
今後、研究開発の成果物を公開することで社会で幅広く使える大規模言語モデルの構築環境を整備。「GitHub」や「Hugging Face」を通じ、多くの研究者や技術者が基盤モデルの改善や新たな応用研究に参画することを促していく。また、ものづくりをはじめとする産業分野などへの応用を想定したマルチモーダル化のためのデータ生成手法や学習手法の開発を手掛ける東海国立大学機構 名古屋大学、大規模言語モデル構築のためのデータや技術を提供するサイバーエージェントとの連携も検討していく。