pgvector 0.7.0 および関連テスト
-
Cohere Embeds Multilingual 3.0 のバイナリベクトルを pgvector 0.7.0 で使えるよう文字列形式に加工するテスト
-
Titan Text Embeddings V2 の通常精度のベクトルをバイナリ量子化して DB に入れるテスト
-
pip
pip install -r requirements.txt
.env
ファイルの内容はこちら。
COHERE_CRED='【Cohere EmbedのAPIキー】'
DB_NAME='【データベース名】'
DB_USER='【同・接続ユーザー名】'
DB_PASSWORD='【同・接続ユーザーのパスワード】'
DB_HOST='【データベースサーバーのエンドポイントURLまたはIPアドレス】'
DB_PORT='【同・ポート番号】'
後者のテストに使うために組み込んでいるデータはこちら。
- https://huggingface.co/datasets/takaaki-inada/databricks-dolly-15k-ja-zundamon
app_titan2_re_rank_bin_index_text.py
と同じディレクトリにdatabricks-dolly-15k-ja-zundamon.json
として配置
This dataset was based on "kunishou/databricks-dolly-15k-ja". This dataset is licensed under CC BY SA 3.0
Last Update : 2023-05-11
databricks-dolly-15k-ja https://github.com/kunishou/databricks-dolly-15k-ja databricks-dolly-15k https://github.com/databrickslabs/dolly/tree/master/data