A.I. Wiki

Do you like this content? We'll send you more.

データセットのカスタム化

すべてのディープラーニングネットワークへの入力データは、単語、画像、その他どんな形態であっても、ベクトル化と呼ばれる工程の一部であるベクトルという数字への変換が行われなければなりません。このベクトルは、行数を増やすことのできる単なる一列の行列です。

DataVec

DataVecはApache2のライセンスを持ち、機械学習ETL(抽出、変換、読み込み)を行うオープンソースのツールです。DataVecの目標は、生データを機械学習ツールが使用できるベクトル形態に変換させることです。

DataVecは、画像をベクトルに変換するツールを提供しています。これには、ディレクトリ名や構造に基づく画像のラベル化も含まれます。また、DataVecはCSVデータを読み取り、フィールドを適切な数値形式に変換するツールも提供しています。

DataVecの例は、弊社のexamplesにあります。

DataVecについての詳細情報が欲しい方はこちらをお読みください。

無料相談

AIの専門家による30分の質疑応答をスケジュールします。

スカイマインドエキスパートと話す