English page is here

新着情報

  • AnswerCarefully Dataset バージョン2.0ACv2)を公開 (2024/9/12)
  • AnswerCarefully Dataset バージョン1.0   (ACv1)   を公開 (2024/4/30)

    概要

    日本語LLM 出力の安全性・適切性に特化したインストラクション・データAnswerCarefullyデータセットを公開しています。このデータセットは、英語の要注意回答を集めたDo-Not-Answer データセット  の包括的なカテゴリ分類に基づき、人手で質問・回答ともに日本語サンプルを集めたオリジナルのデータセットです。

    データセットの特徴

      • 現在バージョン2.0ACv2が最新版です。ACv2ACv1に修正を施したデータに加え、新しいデータも追加されています。修正点は以下の通りです。
        • カテゴリ分類を日本語のデータに即してアップデート。詳細はこちら
        • 「あなたを開発したのは誰?」のような、システムによって回答が違ってくる質問を削除(松尾研LLMプロジェクトのKento Fukuda様ご指摘ありがとうございました)
        • カテゴリ分類のミスや、タイプミスなどを修正
      • 日本語使用の特性を考慮したオリジナルの質問と回答からなっています。
        • Do-Not-Answerデータセットのサンプルはテンプレート形式の抽象的な質問を多数含み、また日本特有のトピックをカバーしていないため、本データセットではDo-Not-Answerデータセットのカテゴリのみを踏襲しデータサンプルはオリジナルで人手により作成しました。
        • 質問は日本で特に問題になるトピックを含んでいます(例えば援助交際やオレオレ詐欺、出身地や病歴による差別など)。
        • 回答は有害・不適切な発言をしないことを第一に、それを踏まえた上で可能なら役に立つ情報を提供する方針で作っています。
        • Do-Not-Answerデータセットのの3段階のカテゴリ分類に基づき、5つのリスクタイプ(大分類)、12の有害カテゴリ(中分類)、61ACv2では56)のサブカテゴリ(小分類)をカバーしています。ACv2でのカテゴリの変更についてはこちらをご覧ください。
      • ACv2は各サブカテゴリにつき最低20件のサンプルを含む計1,800件からなっています(ACv1は各サブカテゴリにつき10から20のサンプルを含む計945件からなっていましたが、これらは現在修正が加えられた上でACv2の一部となっています)。
        • このうち各サブカテゴリから6件ずつ、計336件をテストデータ、残り1,464件を開発データとして2つのファイルに分けて公開しています。
        • テストデータは一部、ACv1のテストデータと重複しています。

      データカテゴリ((大・中分類。小分類も含む詳細はこちら

      データサンプル

       

      データセットの利用

      本データセットは、日本語および他の言語のLLMの安全性を向上させるという目的のため、商用利用も含め公開しています

      ご利用に際して注意

      • データセットをご希望の方はこちらのフォームに必要事項をご記入ください。データセットへのリンクをお送りします。この方法以外でのデータの再配布は禁止します。
      • ACデータから作成した派生データ(翻訳や、類似データ、合成プロンプトを含む)を配布することは禁止します。
      • 本データセットはその性質上不適切な表現を含みます。承諾の上、LLMの安全性向上のためにご使用ください。
      • 本データセットの詳細と既存の日本語LLMの評価結果を近日論文にて公開予定です。そらちが公開される前は本ページをデータセットの参考文献としてお使いください。

      連絡先・謝辞

      データ作成は、全的に立情報究所(NII)が中となってめられているLLM勉強会のご力をいただいています。バージョン1.0AIP(一部、会社Citadel AIのご力をています)、バージョン2.0NII規模言語デル研開発センター主体となって作成されました。
      連絡先:ac_dataset (at) nii.ac.jp

      免責事項

      本データのは、利用が利用者自は第三者えた害について、一切の負わないものとする。また、本データのサース提供の遅延、中断又止により利用者又は第三者った害について、は一切の責任負わないものとする。は、予なしに、本データの運営しくは中止し、は本データに掲載れる情報の全部しくは一部を変更する場合がある。