新着情報
- 5月27日(月)に「いちから Symposium」を開催しました。スライドはこのページ「イベント」において公開しております。
- Weights and Biasesでの講演がYoutubeで公開されました。本プロジェクトの説明をしております(2024/5/13)
- 安全性のためのデータセット「AnswerCarefully」を公開しました(2024/4/30)
- 共同研究外の企業への10329件:ver 004)の商用ライセンス提供の受付開始 (2024/3/21)
概要
LLMの開発のために非常に重要な大規模&高品質な「日本語インストラクションデータ:ichikara-instruction」を構築しました。有償での商用利用も可能です。
下記のビデオ(Weights and Biases様主催のミートアップのトーク)で詳細を説明しております。
データを利用した評価結果(抜粋)
共同研究に参加していただいている「マネーフォーワード」様のhououシステムの評価結果です。Version-003-001データを利用して頂いております。システムはこちらで公開されています。(https://huggingface.co/moneyforward/houou-instruction-7b-v2)
他者含め、より多くの利用結果の情報は「データ公開ページ」に記載されています。
商用利用ライセンスの提供
共同研究にご参加頂かなかった企業向けにも本データの商用利用可能ライセンスをご提供しております。「提供スキーム資料」をご覧の上、下記までご連絡下さい。
- 連絡先:satoshi.sekine (at) riken.jp
イベント
いちから Symposium(2024年5月27日)
データの最新情報と今後の方向性を説明し、関連プロジェクトのトークも行う「いちから Symposium」を開催しました。下記スライドを公開します。
- ichikaraデータの最新情報と今後/関根聡(理研AIP/NII-LLMC/株式会社いちから)
- AnswerCarefully LLM安全性のためのデータ公開/鈴木久美(NII-LLMC/理研AIP/株式会社いちから)
- Money Forward Labの取り組み紹介/北岸郁雄(株式会社マネーフォワード)
- LLM/NLP評価に関するサービス/井之上直也(株式会社いちから/理研AIP/北陸先端大学院大学)
- Nejumiリーダーボードにおけるプレミアムサービス/鎌田啓輔(Weights & Biases)
- 「いちからLINK」へのご招待/大塚美幸(株式会社いちから)
第2回 説明会(2023年10月2日)
このプロジェクトの目的や概要を説明し、すでに作成した約1000のインストラクションの内からの例やその作成過程で見えている問題点、プロジェクトへの共同研究の参加方法を説明し、参加者からの意見をいただくための説明会を開催しました。
第1回 説明会(2023年7月31日)
このプロジェクトの目的や概要を説明し、作成するインストラクションの例や作成スキームを提示し、参加者からの意見をいただくための説明会を開催しました。
共同研究
本データ作成に興味を持つ共同研究企業の募集は2023年10月31日までで終了させていただきました。ただし、共同研究以外の企業・団体に対しても、データ完成時に有償にてデータの商用ライセンスを提供します(下記、「共同研究外企業へのライセンスの提供」をご覧ください)
- 「共同研究スキーム説明資料」
- 共同研究契約締結企業18社様
- 株式会社日本総合研究所
- 三菱電機株式会社
- 株式会社マネーフォワード
- ストックマーク株式会社
- 株式会社レトリバ
- 株式会社オルツ
- 株式会社フィックスターズ
- ソフトバンク株式会社
- ファーストアカウンティング株式会社
- みずほリサーチ&テクノロジーズ株式会社
- 株式会社リコー
- TOPPANデジタル株式会社
- 株式会社JSOL
- 株式会社ELYZA
- 株式会社サイバーエージェント
- 日本電気株式会社
- Stability AI Japan株式会社
- 他匿名1社
過去の情報
- 4802件のデータ(ver.003-001に追加としてver.003-002,003)を公開(2024/3/7)
- 2903件のデータ(ver.003-001)を公開(2023/12/23)
- 1003件のデータ(ver.002-002)を公開(2023/11/3)
- 「第2回 説明会」を行いました(2023/10/2)
- 本ページ(下記)で資料、ビデオを公開しています。
- 50件のサンプルデータを公開(2023/10/1)
- 日経新聞に掲載されました(2023/9/26)
主催
理化学研究所 革新知能統合研究センター 言語情報アクセス技術チーム