最終提出モデル

https://huggingface.co/naoa/gemma-2-9b-base71_lora

自己紹介

Patentfield という特許検索・分析サービス https://patentfield.com を開発しています。 情報検索、自然言語処理に興味関心を持っており、特許情報をより活用できるようにするため、 LLMやその他の技術を特許データに活用していきたいと考えています。

https://x.com/naoa_y

自己紹介

Patentfield という特許検索・分析サービスを開発しています。 情報検索、自然言語処理に興味関心を持っており、特許情報をより活用できるようにするため、 LLMやその他の技術を特許データに活用していきたいと考えています。

https://x.com/naoa_y

ベースモデル

Gemma2-9B

利用データセット

以下のデータセットを約5000件ほどLlama.cppにてQwen2.5-32B-Instructにより独自の合成データを生成しました。

合成データは、<reasoning>タグで推論過程、<reflection>タグで推論過程の評価をした上で、<output>タグで最終的に推論結果を出力するようにしました。

https://huggingface.co/datasets/llm-jp/magpie-sft-v1.0

Author: Hirokazu Kiyomaru and Takashi Kodama. License: Apache License 2.0

上記のデータの一部をQwen2.5-32B-Instructにより独自データ拡張。

https://huggingface.co/Qwen/Qwen2.5-32B-Instruct

ELYZA-tasks-100のタスクを元に独自に簡単なタスクを定義をし、Qwen2.5-32B-Instructにより独自データを生成。