Quilt Dataを創ったKevin Moore(ケヴィン・ムーア)氏とAneesh Karve(アニッシュ・カーヴ)氏はこれまでの4年間、AWS S3のストレージ上にある大量のデータを素早く検索するプラットホームの構築に努めてきた。それはデータサイエンティストたちにS3のバケット内にデータを見つける方法を提供し、さらにそのデータを企業が利用できる形にパッケージすることが目的だ。米国時間9月19日、同社は無料のデータ検索ポータルとしてステルスを脱し、その企業向けサービスを提供するだけでなく、S3の23のリポジトリに存在する3.7PB(ペタバイト)の公開データへの貴重なアクセスを提供する。
それらの公開データに含まれるのは、一般的に利用できるAmazonのレビューのデータや衛星画像、およびそのほかの価値ある一般公開情報だ。使い方はそのほかの検索エンジンと同じくクエリを入力するだけだが、それはウェブや企業のデータリポジトリを検索するのではなく、AWSのS3ストレージに結果を見つける。
検索結果には、探していたデータだけでなく、データサイエンティストたちが機械学習のモデルの構築のために使う標準的なワークスペースであるJupyterノートブックなど、そのデータに関する情報も含まれる。データサイエンティストたちはこれを、自分の機械学習モデルを作るためのベースとして利用できる。
公開データに
コメント