• Databricks
  • Databricks
  • ヘルプセンター
  • ドキュメント
  • ナレッジベース
  • コミュニティ
  • サポート
  • フィードバック
  • Databricksを試す
English
  • English
  • 日本語
  • Português
Amazon Web Services
  • Microsoft Azure
  • Google Cloud Platform
Databricks on AWS

はじめに

  • はじめに
  • Databricksとは
  • DatabricksIQ
  • リリースノート

データの読み込みと管理

  • ガイド
  • データベース・オブジェクトの操作
  • データソースに接続する
  • コンピュートに接続する
  • データの発見
  • データのクエリ―
  • データを取り込む
  • ファイルの操作
  • データの変換
  • ワークフローのスケジュールとオーケストレーション
  • データとAI資産を監視する
  • 外部システムでの読み取り
  • データを安全に共有

データの取り扱い

  • Delta Live Tables
  • 構造化ストリーミング
  • AIと機械学習
    • チュートリアル
    • AI playground
    • SQLのAI関数
    • AIゲートウェイ
    • モデルのデプロイ
    • モデルのトレーニング
    • AIのためのデータ提供
      • 特徴量管理
      • ベクトル検索
        • ベクトル検索インデックスの作成とクエリ―
        • Mosaic AI Vector Searchのベストプラクティス
    • AIの評価
    • 生成AIアプリの構築
    • MLOps
    • AI エージェントと ML モデルのライフサイクルのための MLflow
    • 生成AIモデルのメンテナンスポリシー
    • 統合
    • グラフとネットワーク解析
    • リファレンスソリューション
  • 生成AI チュートリアル
  • BI
  • データウェアハウジング
  • ノートブック
  • Delta Lake
  • 開発者
  • 技術パートナー

管理

  • アカウントとワークスペースの管理
  • セキュリティとコンプライアンス
  • データガバナンス(Unity Catalog)
  • レイクハウスアーキテクチャ

参照とリソース

  • 参照
  • リソース
  • 今後の予定
  • ドキュメントアーカイブ

更新しました 2025/02/18

フィードバックの送信

  • ドキュメント
  • DatabricksにおけるAIと機械学習
  • ML と AI のデータを提供する
  • Mosaic AI Vector Search
  • Mosaic AI Vector Searchのベストプラクティス

Mosaic AI Vector Searchのベストプラクティス

この記事では、Mosaic AI Vector Search を最も効果的に使用するためのヒントをいくつか紹介します。

レイテンシーを最適化するための推奨事項

  • ネットワークに最適化されたルートを活用するには、サービス プリンシパル承認フローを使用します。

  • Python SDK の最新バージョンを使用してください。

  • テストするときは、約 16 から 32 のコンカレンシーから開始します。 同時実行性が高くても、高いパフォーマンスは得られません。

  • トークン単位の従量課金基盤モデルの代わりに、トークン 最大限のパフォーマンスで提供されるモデル (たとえば、bge-large-en または微調整されたバージョン) を使用します。

GPU を使用する場合

  • CPU は、基本的なテストと小さなデータセット (最大 100 行) にのみ使用します。

  • GPU コンピュート タイプの場合、 Databricks GPU-small または GPU-medium の使用を推奨しています。

  • GPU コンピュート スケールアウトの場合、同時実行性を高めると取り込み時間が改善される可能性がありますが、合計データセット サイズやインデックス メタデータなどの要因によって異なります。

画像、ビデオ、またはテキスト以外のデータの操作

  • 埋め込みを事前に行い、自己管理型の埋め込みで Delta Sync Index を使用します。

  • 画像などのバイナリ形式は、待機時間に悪影響を与えるため、メタデータとして保存しないでください。 代わりに、ファイルのパスをメタデータとして格納します。

埋め込みシーケンスの長さ

  • 埋め込みモデルのシーケンスの長さをチェックして、ドキュメントが切り捨てられていないことを確認します。 たとえば、BGE は 512 個のトークンのコンテキストをサポートします。 より長いコンテキスト要件の場合は、 gte-large-en-v1.5 を使用します。

トリガーによる同期モードを使用してコストを削減する

  • 検索インデックスを更新するための最もコスト効率の高いオプションはTriggeredです。 数秒の遅延でソース テーブルの変更にインデックスを増分同期する必要がある場合にのみ、 [連続]を選択します。 どちらの同期モードも増分更新を実行し、最後の同期以降に変更されたデータのみが処理されます。


© Databricks 2025 です。 全著作権所有。 Apache、Apache Spark、Spark、および Spark のロゴは、 Apache Software Foundation の商標です。

フィードバックをお送りください | プライバシーに関する通知 | 利用規約 | 現代奴隷制に関する声明 | カリフォルニア州のプライバシー | お客様のプライバシーに関する選択