• Databricks
  • Databricks
  • Centro de ajuda
  • Documentação
  • Base de conhecimento
  • Comunidade
  • Suporte
  • Comentários
  • Experimente o Databricks
English
  • English
  • 日本語
  • Português
Amazon Web Services
  • Microsoft Azure
  • Google Cloud Platform
Databricks on AWS

Primeiros passos

  • Primeiros passos
  • O que é o Databricks?
  • DatabricksIQ
  • Notas sobre a versão

Carregar e gerenciar dados

  • guia
  • Trabalhar com objetos de banco de dados
  • Conectar-se a fontes de dados
  • Conectar-se ao compute
  • Descobrir dados
  • Consultar dados
  • Ingerir dados
  • Trabalhe com arquivos
  • Transformar dados
  • programar e orquestrar o fluxo de trabalho
  • Monitorar dados e ativos de IA
  • Leia com sistemas externos
  • Compartilhe dados com segurança

Trabalhar com dados

  • Delta Live Tables
  • Transmissão estruturada
  • IA e machine learning
    • Tutoriais
    • Playground de IA
    • Funções de IA em SQL
    • Gateway de IA
    • modelos implantados
    • Modelos de ensino
    • Servir dados para IA
      • gerenciamento de recursos
      • Vector Search
        • Como criar e consultar um índice de pesquisa de vetores
        • Práticas recomendadas para o Mosaic AI Vector Search
    • Avaliar a IA
    • Crie aplicativos de IA generativa
    • MLOps
    • MLflow para o agente AI e o ciclo de vida do modelo ML
    • Política de manutenção do modelo Gen IA
    • Integrações
    • análise gráfica e de rede
    • Soluções de referência
  • IA generativa tutorial
  • Business Intelligence
  • Data warehousing
  • Notebooks
  • Delta Lake
  • Desenvolvedores
  • Parceiros tecnológicos

Administração

  • Administração de conta e workspace
  • Segurança e compliance
  • Governança de dados (Unity Catalog)
  • Arquitetura Lakehouse

Referência e recursos

  • Referência
  • Recursos
  • O que vem por aí?
  • Arquivo de documentação

Atualizado 18/02/2025

Envie-nos comentários

  • Documentação
  • IA e machine learning em Databricks
  • Servir dados para ML e IA
  • Mosaic AI Vector Search
  • Práticas recomendadas para o Mosaic AI Vector Search

Práticas recomendadas para o Mosaic AI Vector Search

Este artigo dá algumas dicas de como usar o site Mosaic AI Vector Search de forma mais eficaz.

Recomendações para otimizar a latência

  • Use o fluxo de autorização da entidade de serviço para aproveitar as vantagens das rotas otimizadas pela rede.

  • Use a versão mais recente do Python SDK.

  • Ao testar, comece com uma concorrência de cerca de 16 a 32. alta simultaneidade não produz uma taxa de transferência mais alta.

  • Use um modelo servido com provisionamento Taxa de transferência (por exemplo, bge-large-en ou uma versão ajustada), em vez de um modelo de fundação pay-per-tokens.

Quando usar GPUs

  • Use CPUs somente para testes básicos e para pequenos conjuntos de dados (até 100s de linhas).

  • Para o tipo de GPU compute, o site Databricks recomenda o uso de GPU-small ou GPU-medium.

  • Para a GPU compute escala-out, escolher mais simultaneidade pode melhorar os tempos de ingestão, mas isso depende de fatores como o tamanho total do dataset e os metadados do índice.

Trabalhar com imagens, vídeos ou dados não textuais

  • Pré-compute os embeddings e use um Delta Sync Index com embeddings autogerenciáveis.

  • Não armazene formatos binários, como imagens, como metadados, pois isso afeta negativamente a latência. Em vez disso, armazene o caminho do arquivo como metadados.

Comprimento da sequência de incorporação

  • Verifique o comprimento da sequência do modelo de incorporação para garantir que os documentos não estejam sendo truncados. Por exemplo, o BGE suporta um contexto de 512 tokens. Para requisitos de contexto mais longos, use gte-large-en-v1.5.

Use o modo de sincronização acionada para reduzir os custos

  • A opção mais econômica para atualizar um índice de pesquisa vetorial é o Triggered. Selecione Continuous somente se o senhor precisar sincronizar o índice de forma incremental com as alterações na tabela de origem com uma latência de segundos. Ambos os modos de sincronização realizam atualizações incrementais - somente os dados que foram alterados desde a última sincronização são processados.


© Databricks 2025. Todos os direitos reservados. Apache, Apache Spark, Spark e o logotipo do Spark são marcas registradas da Apache Software Foundation.

Envie-nos seus comentários | Aviso de privacidade | Termos de uso | Declaração sobre escravidão moderna | Privacidade na Califórnia | Suas opções de privacidade