Scala のDatabricks 接続のトラブルシューティング
注
この記事では、Databricks Connect for Databricks Runtime 13.3 LTS 以降について説明します。
この記事では、Databricks Connect for Scala のトラブルシューティング情報を提供します。 Databricks Connect を使用すると、一般的な IDE、ノートブック サーバー、およびカスタム アプリケーションを Databricks クラスターに接続できます。 「Databricks Connect とは」を参照してください。この記事の Python バージョンについては、「 Python の Databricks 接続のトラブルシューティング」を参照してください。
ファイル名、ディレクトリ名、またはボリューム ラベルの構文が Windows で正しくない
問題: Windows で Databricks Connect を使用していて、次のように表示されます。
The filename, directory name, or volume label syntax is incorrect.
原因: Databricks Connect は、 パスにスペースがあるディレクトリにインストールされました。
ソリューション: これを回避するには、スペースを含まないディレクトリ パスにインストールするか、 短い名前の形式を使用してパスを構成します。
エラー: MemoryUtil の初期化に失敗しました
問題: DatabricksSession
をビルドしようとすると、 Failed to initialize MemoryUtil
エラーが返されます。
原因 : Apache Arrow は Arrow Databricks Connect クライアントの依存関係であり、リフレクションを使用してプライベート Java メソッドにアクセスしようとしています。これは、セキュリティ上の理由から Java 17 でデフォルトでブロックされています。
ソリューション:
JVMの初期化前に、次のJVMフィールドを設定します。
--add-opens=java.base/java.nio=org.apache.arrow.memory.core,ALL-UNNAMED
詳細については、「 Apache Arrow Java Compatibility」を参照してください。
ヒント
IntelliJ で Java オプションを設定するには、 IntelliJ の実行/デバッグ構成を参照してください。