自動文字起こしレコーダー「VOITER SR302Pro」発売! iFLYTEKとキヤノンマーケティングジャパンがタッグを組んだ理由とは
7月1日、自動文字起こしレコーダー「VOITER SR302Pro」が発売となった。開発と製造を担うiFLYTEKの日本法人iFLYTEK JAPAN AI SOLUTIONS株式会社(以下、iFLYTEK JAPAN)と国内販売を担うキヤノンマーケティングジャパン株式会社(以下、キヤノンMJ)の両社に、国内市場での販売戦略や取り組み、今回、新製品で完全オフライン機能を実現した開発背景などについて聞いた。
iFLYTEK JAPAN 孫嘉人取締役副社長COO(以下、敬称略) iFLYTEKは音声認識や音声合成、機械翻訳、画像認識など自社のAIコア技術を強みとするハイテク上場企業です。数多くの国際的な権威のあるコンテスト*1で1位を獲得しています。
近年は自社AIデバイス製品の開発に力を入れ、売り上げは急成長しています。2020年にiFLYTEKの日本法人を設立して間もない頃、キヤノンMJにこれからの日本市場における当社AIデバイス製品の大きな可能性に共感いただきました。当社からは、キヤノンMJのマーケテイングと販売ネットワークの力を期待しました。そこで、当社製品の日本市場での浸透に向けて、お互いに戦略販売パートナー契約を結ばせていただきました。
キヤノンマーケティングジャパン株式会社 コンスーマビジネスユニット コンスーマプロダクト営業部 大井部長(以下、敬称略) キヤノンMJが新規事業を探索していく中で、当社の強みであるB 2 CもB2Bも幅広くサポートでき、当社のチャネルカバーを活かせる商品はないかと探していました。
そんな中でiFLYTEK社と出会い、中国でBATISと呼ばれる5大AI企業の1社であるその技術力に関心を持ち、実際に商品を試すことで「当社のお客様たちの業務改善に貢献できる」との確信を持ちました。私たちも会議で議事録をとる機会が多いのですが、議事録を作成する係がそちらにかかりきりになってしまって発言できなかったり、発言に追いつけずに正確な記述ができなかったりするという問題を抱えていました。そういった問題を大きく改善してくれる商品だなと感じ、パートナーとなることを決めました。
孫 新型コロナは人々の仕事と生活に大きな変化をもたらすと同時に、新たな顧客ニーズやDX促進の定着など、大きなビジネスチャンスも生まれています。例えば、テレワークやWeb会議などが急速に普及している中で、議事録作成や情報の共有と管理に課題を感じる方が増えています。2021年8月から当社は「議事録に、AI革命。」というキャッチコピーで、人が話した音声を自動で文字起こしできるAIライティング レコーダー「VOITER」を発売しました。VOITERを使うことで、従来の議事録作業にかかっていた時間を短縮できます。現在、自治体や公共機関、大学、上場企業など導入実績は2,000社以上を突破しています。
新型コロナが落ち着いた後、リアルとテレワークのハイブリッドワークが増えると言われていますが、利用シーンの多様化により、さらにAIライティング レコーダー製品の需要が増えると考えています。また、インバウンド需要の復活も期待でき、多言語の文字起こしや翻訳機製品などの需要増加も見込んでいます。
大井 新型コロナによりDXが進み、「働き方改革」や「業務の効率化」はどの企業にとっても重点的な取り組みや課題になっています。AIによる文字起こし製品の市場はまだ拡大の途中と考えますが、しっかりとお客様に知っていただくことで市場は拡大していくものと考えています。今後、海外からの旅行者が増えることにより、iFLYTEK社の持つ翻訳技術を活かした商品も市場に導入していきたいと考えています。
孫 SR502Jは2,000社以上で使用していただき、高い評価を得ています。特に、「え~、あ~」など感嘆詞の自動除去や話者の自動識別、Wordファイル形式の議事録出力といった文字起こしに欠かせない機能の精度の高さが好評です。「議事録の作業時間が半減し、重宝している」など励ましになるユーザーの声もいただいています。今後、さらに文字起こし精度の向上と専門用語の継続的な強化なども期待されています。
また、法曹界・医療業界・政治家・士業など守秘義務があるご職業の方から、業種の規制もあってインターネット接続できない利用シーンが多く、使用するシーンが制限されているなどのお声も多くいただいています。そこで、外部通信が一切不要でも文字起こしのできる完全オフラインモデルSR302Proを開発しました。
キヤノンマーケティングジャパン株式会社 コンスーマビジネスユニット コンスーマプロダクト営業部 コンスーマプロダクトニュービジネス課 別府課長 現在、発売前のSR302Proのデモ機を用意して多くのお客様に体験していただいていますが、「業務効率が改善しました」「聞き漏れがなく助かっています」などの多くの声をいただいています。一方で、SR502Jでも話者分離機能がほしいなどのいろいろな要望をいただき、そういった要望に対してもRecorder Stationのアップデートで対応をいただくなど、iFLYTEK社の素早い対応に感謝しています。
また、「オンライン上に機密情報を上げることへ漠然とした懸念があり、導入したいが具体的にどういった条件であれば可能なのかの社内基準が整っていない」という声もありました。今回のSR302Proはそういったお客様へのソリューションになると期待をかけています。
――先ほど、新製品SR302Proのメインターゲットは、士業の方や法曹界・医療業界・政治家など機密性の高い会議や面談を要する職業の方とのことでしたが、完全オフラインモデルのSR302Proを開発する上で苦労された点を教えてください。
孫 SR302Proのようなコンパクトサイズのデバイス製品で、完全オフラインでスムーズに文字起こしを実現するには、非常に高度な技術が必要です。
例えば、録音音声をデバイス上で連続的に文字起こしするためには、長時間使用してもデバイスの発熱を抑えなければならないという技術的な難点があります。当社は、CPUのメイン周波数を下げて発熱を抑える方法を採用し、オフライン文字起こし処理中の動作周波数を妥当なレベルに保てるようにしました。これにより、オフライン文字起こしのリアルタイム性能を確保しながら、デバイス全体の温度を適切な範囲に保つことが実現できたのです。そして、文字起こしの精度についても、今後はどんどん改善して進化していきます。これは自社のAIコア技術だからこそ実現できるものだと思っています。
孫 例えば、法曹界の方であればクライアントとの面談時。医療業界の方でしたら初診、手術前の注意事項説明。企業であれば取締役会など。いずれも高い機密性が求められるシチュエーションであり、そうしたシーンでの記録や文字起こしにおすすめします。
他の用途としては英会話の学習があります。そのときに会話の練習はできても、話した内容を授業後に復習するのは難しいものです。SR302Proを使えば、その場でリアルタイムに文字起こし表示で確認できますし、セッションが終わったらすぐに話した内容を振り返ることもできます。外国語の練習ツールとして活用するのもおすすめです。
また、ご高齢者の方や難聴者にも手軽に文字によるコミュニケーションツールとしても活用していただけます。ご入学祝や還暦のお祝い、プレゼントとしても大変喜ばれるのではないかと思います。
――完全オフライン機能以外に、おすすめする機能はありますか?
孫 SR302Proは日本語の他、英語、中国語、韓国語など5言語に対応しています。海外からの旅行者や海外に行った先でのコミュニケーションにも活躍が期待できるでしょう。
――キヤノンMJとしてはiFLYTEK社に今後、何を期待しますか?
大井 さらなる商品ラインアップの拡大になります。iFLYTEK社は大きな企業で、たくさんの商品カテゴリーを抱えています。文字起こしはほんの一部分の商品であり、教育や交通など多くの産業でAIを活かしたサービスを開発しています。今後、日本市場にあった商品やサービスを順次展開していけることを期待しています。
――最後に、iFLYTEK社の今後の展開を教えてください。
孫 iFLYTEK社は高いAI技術力を生かしたAIソリューションやAIデバイス製品などで、中国でたくさんの成功事例とノウハウを積んできました。iFLYTEK JAPANはその中で、日本市場のニーズと機会に合わせて、今後もさまざまな革新的な新商品・サービスを日本のお客様に届けていきたいと思います。
新型コロナで世の中の状況は大きく変わりましたが、新型コロナで生まれた新たなニーズに対しても、ターゲットを広げて、当社の技術を活用していきたいと思います。5年後には年商100億円以上の事業規模を目指していきたいと考えています。
*1 2016~2020年(隔年開催)雑音環境での音声認識技術を競う国際コンテスト「CHiME」で3回連続1位を獲得
2006~2019年 音声合成技術を競う国際コンテスト「Blizzard Challenge」で14年連続1位を獲得
2021年 話者分離技術の国際コンペティション「DIHARD3」で世界1位の性能評価を獲得
2021年 IWSLT(話し言葉翻訳の国際コンペティション) の同時通訳ベンチマークタスクで1位優勝
など
【VOITER SR302Proの販売価格】
■VOITER SR302Pro:3万9600円(税込)(希望販売価格)
無料で文字起こし使い放題。
■VOITER SR302Pro 製品ページ
■VOITER SR302Pro ECサイトページ
■EC支払方法:請求書払いまたはクレジットカード支払い
※企業間決済サービス 導入企業数No.1のPaid(https://paid.jp/)を利用しています。
与信審査など、Paidが代行しております。
キヤノンMJが戦略販売パートナーに
――両社が自動文字起こしレコーダー「VOITER」の販売で一緒に取り組みはじめたきっかけや経緯について教えてください。iFLYTEK JAPAN 孫嘉人取締役副社長COO(以下、敬称略) iFLYTEKは音声認識や音声合成、機械翻訳、画像認識など自社のAIコア技術を強みとするハイテク上場企業です。数多くの国際的な権威のあるコンテスト*1で1位を獲得しています。
近年は自社AIデバイス製品の開発に力を入れ、売り上げは急成長しています。2020年にiFLYTEKの日本法人を設立して間もない頃、キヤノンMJにこれからの日本市場における当社AIデバイス製品の大きな可能性に共感いただきました。当社からは、キヤノンMJのマーケテイングと販売ネットワークの力を期待しました。そこで、当社製品の日本市場での浸透に向けて、お互いに戦略販売パートナー契約を結ばせていただきました。
キヤノンマーケティングジャパン株式会社 コンスーマビジネスユニット コンスーマプロダクト営業部 大井部長(以下、敬称略) キヤノンMJが新規事業を探索していく中で、当社の強みであるB 2 CもB2Bも幅広くサポートでき、当社のチャネルカバーを活かせる商品はないかと探していました。
そんな中でiFLYTEK社と出会い、中国でBATISと呼ばれる5大AI企業の1社であるその技術力に関心を持ち、実際に商品を試すことで「当社のお客様たちの業務改善に貢献できる」との確信を持ちました。私たちも会議で議事録をとる機会が多いのですが、議事録を作成する係がそちらにかかりきりになってしまって発言できなかったり、発言に追いつけずに正確な記述ができなかったりするという問題を抱えていました。そういった問題を大きく改善してくれる商品だなと感じ、パートナーとなることを決めました。
議事録作業にかかっていた時間が短縮
――新型コロナウイルスの影響により、国内市場の状況も変わってきています。自動文字起こしレコーダーの市場環境をどのようにとらえていますか?孫 新型コロナは人々の仕事と生活に大きな変化をもたらすと同時に、新たな顧客ニーズやDX促進の定着など、大きなビジネスチャンスも生まれています。例えば、テレワークやWeb会議などが急速に普及している中で、議事録作成や情報の共有と管理に課題を感じる方が増えています。2021年8月から当社は「議事録に、AI革命。」というキャッチコピーで、人が話した音声を自動で文字起こしできるAIライティング レコーダー「VOITER」を発売しました。VOITERを使うことで、従来の議事録作業にかかっていた時間を短縮できます。現在、自治体や公共機関、大学、上場企業など導入実績は2,000社以上を突破しています。
新型コロナが落ち着いた後、リアルとテレワークのハイブリッドワークが増えると言われていますが、利用シーンの多様化により、さらにAIライティング レコーダー製品の需要が増えると考えています。また、インバウンド需要の復活も期待でき、多言語の文字起こしや翻訳機製品などの需要増加も見込んでいます。
大井 新型コロナによりDXが進み、「働き方改革」や「業務の効率化」はどの企業にとっても重点的な取り組みや課題になっています。AIによる文字起こし製品の市場はまだ拡大の途中と考えますが、しっかりとお客様に知っていただくことで市場は拡大していくものと考えています。今後、海外からの旅行者が増えることにより、iFLYTEK社の持つ翻訳技術を活かした商品も市場に導入していきたいと考えています。
完全オフライン対応でセキュリティが重視される会議や面談に最適
――新製品VOITER SR302Proの開発背景をお聞きする前に、既存製品VOITER SR502Jのユーザーからの評価や声はいかがでしたか?孫 SR502Jは2,000社以上で使用していただき、高い評価を得ています。特に、「え~、あ~」など感嘆詞の自動除去や話者の自動識別、Wordファイル形式の議事録出力といった文字起こしに欠かせない機能の精度の高さが好評です。「議事録の作業時間が半減し、重宝している」など励ましになるユーザーの声もいただいています。今後、さらに文字起こし精度の向上と専門用語の継続的な強化なども期待されています。
また、法曹界・医療業界・政治家・士業など守秘義務があるご職業の方から、業種の規制もあってインターネット接続できない利用シーンが多く、使用するシーンが制限されているなどのお声も多くいただいています。そこで、外部通信が一切不要でも文字起こしのできる完全オフラインモデルSR302Proを開発しました。
キヤノンマーケティングジャパン株式会社 コンスーマビジネスユニット コンスーマプロダクト営業部 コンスーマプロダクトニュービジネス課 別府課長 現在、発売前のSR302Proのデモ機を用意して多くのお客様に体験していただいていますが、「業務効率が改善しました」「聞き漏れがなく助かっています」などの多くの声をいただいています。一方で、SR502Jでも話者分離機能がほしいなどのいろいろな要望をいただき、そういった要望に対してもRecorder Stationのアップデートで対応をいただくなど、iFLYTEK社の素早い対応に感謝しています。
また、「オンライン上に機密情報を上げることへ漠然とした懸念があり、導入したいが具体的にどういった条件であれば可能なのかの社内基準が整っていない」という声もありました。今回のSR302Proはそういったお客様へのソリューションになると期待をかけています。
――先ほど、新製品SR302Proのメインターゲットは、士業の方や法曹界・医療業界・政治家など機密性の高い会議や面談を要する職業の方とのことでしたが、完全オフラインモデルのSR302Proを開発する上で苦労された点を教えてください。
孫 SR302Proのようなコンパクトサイズのデバイス製品で、完全オフラインでスムーズに文字起こしを実現するには、非常に高度な技術が必要です。
例えば、録音音声をデバイス上で連続的に文字起こしするためには、長時間使用してもデバイスの発熱を抑えなければならないという技術的な難点があります。当社は、CPUのメイン周波数を下げて発熱を抑える方法を採用し、オフライン文字起こし処理中の動作周波数を妥当なレベルに保てるようにしました。これにより、オフライン文字起こしのリアルタイム性能を確保しながら、デバイス全体の温度を適切な範囲に保つことが実現できたのです。そして、文字起こしの精度についても、今後はどんどん改善して進化していきます。これは自社のAIコア技術だからこそ実現できるものだと思っています。
インバウンドや外国語の練習ツール、高齢者、難聴者にも提案できる
――完全オフライン機能が役立つ具体的なシーンやシチュエーションについて教えてください。孫 例えば、法曹界の方であればクライアントとの面談時。医療業界の方でしたら初診、手術前の注意事項説明。企業であれば取締役会など。いずれも高い機密性が求められるシチュエーションであり、そうしたシーンでの記録や文字起こしにおすすめします。
他の用途としては英会話の学習があります。そのときに会話の練習はできても、話した内容を授業後に復習するのは難しいものです。SR302Proを使えば、その場でリアルタイムに文字起こし表示で確認できますし、セッションが終わったらすぐに話した内容を振り返ることもできます。外国語の練習ツールとして活用するのもおすすめです。
また、ご高齢者の方や難聴者にも手軽に文字によるコミュニケーションツールとしても活用していただけます。ご入学祝や還暦のお祝い、プレゼントとしても大変喜ばれるのではないかと思います。
――完全オフライン機能以外に、おすすめする機能はありますか?
孫 SR302Proは日本語の他、英語、中国語、韓国語など5言語に対応しています。海外からの旅行者や海外に行った先でのコミュニケーションにも活躍が期待できるでしょう。
――キヤノンMJとしてはiFLYTEK社に今後、何を期待しますか?
大井 さらなる商品ラインアップの拡大になります。iFLYTEK社は大きな企業で、たくさんの商品カテゴリーを抱えています。文字起こしはほんの一部分の商品であり、教育や交通など多くの産業でAIを活かしたサービスを開発しています。今後、日本市場にあった商品やサービスを順次展開していけることを期待しています。
――最後に、iFLYTEK社の今後の展開を教えてください。
孫 iFLYTEK社は高いAI技術力を生かしたAIソリューションやAIデバイス製品などで、中国でたくさんの成功事例とノウハウを積んできました。iFLYTEK JAPANはその中で、日本市場のニーズと機会に合わせて、今後もさまざまな革新的な新商品・サービスを日本のお客様に届けていきたいと思います。
新型コロナで世の中の状況は大きく変わりましたが、新型コロナで生まれた新たなニーズに対しても、ターゲットを広げて、当社の技術を活用していきたいと思います。5年後には年商100億円以上の事業規模を目指していきたいと考えています。
*1 2016~2020年(隔年開催)雑音環境での音声認識技術を競う国際コンテスト「CHiME」で3回連続1位を獲得
2006~2019年 音声合成技術を競う国際コンテスト「Blizzard Challenge」で14年連続1位を獲得
2021年 話者分離技術の国際コンペティション「DIHARD3」で世界1位の性能評価を獲得
2021年 IWSLT(話し言葉翻訳の国際コンペティション) の同時通訳ベンチマークタスクで1位優勝
など
【VOITER SR302Proの販売価格】
■VOITER SR302Pro:3万9600円(税込)(希望販売価格)
無料で文字起こし使い放題。
■VOITER SR302Pro 製品ページ
■VOITER SR302Pro ECサイトページ
■EC支払方法:請求書払いまたはクレジットカード支払い
※企業間決済サービス 導入企業数No.1のPaid(https://paid.jp/)を利用しています。
与信審査など、Paidが代行しております。