#RTranslatorとは何か?Android用のオープンソース,無料,オフラインのリアルタイム翻訳アプリ #六19

https://github.com/niedev/RTranslator より

#RTranslatorとは何か?Android用のオープンソース,無料,オフラインのリアルタイム翻訳アプリ #六19

RTranslator は、Android 用のオープンソース、無料、オフラインのリアルタイム翻訳アプリです。

アプリを持っている人と接続し、Bluetooth ヘッドフォンを接続し、携帯電話をポケットに入れて、他の人があなたの言語を話したかのように会話することができます。









会話モード

会話モードは RTranslator の主な機能です。このモードでは、このアプリを使用する別の電話に接続できます。ユーザーが接続要求を受け入れた場合:

  1. 話すと、携帯電話(接続されている場合は Bluetooth ヘッドセット)がオーディオをキャプチャします。
  2. キャプチャされたオーディオはテキストに変換され、対話者の電話に送信されます。
  3. 対話者の電話は、受け取ったテキストを彼の言語に翻訳します。
  4. 対話者の電話は、翻訳されたテキストをオーディオに変換し、スピーカーから(または携帯電話に接続されている場合は対話者の Bluetooth ヘッドセットで)再現します。

これらすべてを両方向に。

各ユーザーは複数の接続電話を持つことができるため、複数のユーザー間の会話を任意の組み合わせで翻訳できます。



ウォーキートーキーモード

会話モードが誰かと長い会話をするのに便利な場合、このモードは代わりに、路上で情報を求めたり、店員と話したりするなど、迅速な会話のために設計されています。

このモードは、二人の間の会話を変換するだけで、Bluetooth ヘッドセットでは動作せず、順番に話さなければなりません。これは実際の同時翻訳ではありませんが、一台の電話だけで動作できます。

このモードでは、スマートフォンのマイクは 2 つの言語(トランシーバー トーキー モードの同じ画面で選択可能)で同時に聴くことができます。
アプリは、対話者が話している言語を検出し、音声を他の言語に翻訳し、テキストを音声に変換してから、電話スピーカーから再現します。TTS が終了すると、自動的にリスニングが再開されます。



テキスト翻訳モード

このモードは単なる古典的なテキスト翻訳者ですが、常に便利です。



全般的な

RT ランスレーターが使用します メタ の NLLB 翻訳と オープンアイのささやき 音声認識については、どちらもオープンソースであり最先端の AI であり、優れた品質を持ち、電話で直接実行できるため、絶対的なプライバシーと、品質を損なうことなくオフラインでも RTranslator を使用する可能性が保証されます。

また、RTranslator はバックグラウンドでも動作し、電話機がスタンバイ状態になったり、他のアプリを使用したりする場合にも機能します(会話モードまたは WalkieTalkie モードを使用する場合のみ)。ただし、一部の電話機はバックグラウンドで電源を制限するため、その場合はそれを避けて、画面をオンにしながらアプリを開いたままにしておくことをお勧めします。





バージョン 2。0 の新機能

Google API は に置き換えられました メタ の NLLB 翻訳と オープンアイのささやき 音声認識について。これらの AI モデルは携帯電話で直接実行されるため、アプリは完全に無料で、構成は必要ありません!

古典的なテキスト翻訳モードが追加されました。

Bluetooth LE デバイス検索を改善しました。

いくつかのバグを修正しました。



パフォーマンス

RAM の消費と実行時間を最小限に抑えるために AI モデルを大幅に最適化しましたが、クラッシュするリスクなしにアプリを使用できるようにするには、少なくとも電話が必要です 6GB の RAM, そして、十分な実行時間を持つためには、十分な CPU を備えた電話機が必要です。

かなり下品な電話をお持ちの場合(または最高速度が必要な場合は)、いつでも使用できます RT トランスレータのバージョン 1。0 (ただし、google API を使用しているため、無料ではなく、初期設定が必要です)。



ダウンロード

アプリをインストールするには、アプリの apk ファイルの最新バージョンをダウンロードします https://github.com/niedev/RTranslator/releases/ そしてそれをインストールします(他のファイルを無視すると、最初の開始時にアプリによって自動的にダウンロードされます)。



最初の起動時に、翻訳と音声認識(1,2GB)のモデルをダウンロードする必要があり、完了すると翻訳を開始できます。



サポートされている言語

サポートされている言語は次のとおりです:

アラビア語、ブルガリア語、カタロニア語、中国語、チェコ語、デンマーク語、ドイツ語、ギリシャ語、英語、スペイン語、フィンランド語、フランス語、クロアチア語、イタリア語、日本語、韓国語、オランダ語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、スロバキア語、スウェーデン語、タミル語、タイ語、トルコ語、ウクライナ語、ウルドゥー語、ベトナム語。



プライバシー

プライバシーは基本的権利です。そのため、RTranslator は個人データを収集しません(サーバーさえ持っていません)。詳細については、 をお読みください プライバシーポリシー (現時点では RTranslator 1,0 と同じプライバシー ポリシーですが、将来的には更新します)。



ライブラリとモデル

RTranslator は次の外部ライブラリを使用します:

ブルートゥースコミュニケーター (オープンソース): デバイス間の Bluetooth LE 通信に使用されます。

ギャラリー画像セレクター (オープンソース): ギャラリーからプロフィール画像を選択してトリミングするために使用されます。

Onnx ランタイム (オープンソース): AI モデルのアクセラレーターエンジンとして使用される。

(オープンソース): NLLB の入力テキストのトークン化に使用されます。

Ml キット (クローズドソース): WalkieTalkie モードでの言語の識別に使用されます。

そして次の AI モデル:

オランダ通貨単位: 使用されるモデルは、KV キャッシュを備えた NLLB-Distilled-600M です。

囁く: 使用されるモデルは KV のキャッシュが付いているささやき小 244M です。

両方のモデルを onnx 形式に変換し、int8 で量子化しました(品質損失がほぼゼロになるように一部の重みを除く)。また、モデルの一部を分離して RAM 消費量を削減しました(この分離がなければ、実行時に一部の重みが重複し、予想よりも多くの RAM が消費されました)。



寄付

これはオープンソースで完全に広告のないアプリです、私はそれからお金を稼ぎません。

したがって、プロジェクトが好きで、感謝してプロジェクトをサポートしたいのであれば、下のボタンをクリックして PayPal 経由で寄付をすることができます(どの金額も受け入れられます)。



寄付する場合、または星を生きる場合は、ありがとう



バグと問題点

^^^ ^^。所属:一部の言語では、TTS は機能しません。テキスト読み上げエンジンを再インストールして解決します。
Bluetooth 接続が切断されることがあります。

バグを発見した場合は、問題を開くか、電子メールを書いて報告してください



同時通訳をお楽しみください。

コメント

このブログの人気の投稿

nitter.netが2021年1月31日から沈黙。代替インスタンスは?

#INVIDIOUSを用いて広告なしにyoutubeをみる方法 #士17

#shadps4とは何か?shadps4は早いプレイステーション4用エミュレータWindowsを,Linuxそしてmacの #八21