ONNX Runtimeとは?
ONNX Runtime は、Microsoft主導で開発されたAI推論エンジン。ONNX(Open Neural Network Exchange)形式のモデルを、サーバー・モバイル・ブラウザまでクロスプラットフォームで実行できます。
主な特徴
- マルチプラットフォーム: CPU・GPU・WebAssembly・モバイル
- 最適化済み: TensorRT・OpenVINO連携で高速化
- 軽量: Wasm版は数MBで動作
Local-First AIでの活用
WebAssembly版を使うことで、ブラウザ内で画像分類・OCR・NLPなどのAI推論が完結。機密データをサーバーに送らない設計を実現します。
Tufe Companyの採用
JobDoneBotではONNX Runtime Webを活用し、ブラウザ内で画像処理AIを実行。JobDoneBot Enterpriseでオンプレ構築も提供。