https://huggingface.co/naoa/gemma-2-9b-base71_lora
Patentfield という特許検索・分析サービス https://patentfield.com を開発しています。 情報検索、自然言語処理に興味関心を持っており、特許情報をより活用できるようにするため、 LLMやその他の技術を特許データに活用していきたいと考えています。
Patentfield という特許検索・分析サービスを開発しています。 情報検索、自然言語処理に興味関心を持っており、特許情報をより活用できるようにするため、 LLMやその他の技術を特許データに活用していきたいと考えています。
Gemma2-9B
以下のデータセットを約5000件ほどLlama.cppにてQwen2.5-32B-Instructにより独自の合成データを生成しました。
合成データは、<reasoning>タグで推論過程、<reflection>タグで推論過程の評価をした上で、<output>タグで最終的に推論結果を出力するようにしました。
https://huggingface.co/datasets/llm-jp/magpie-sft-v1.0
Author: Hirokazu Kiyomaru and Takashi Kodama. License: Apache License 2.0
上記のデータの一部をQwen2.5-32B-Instructにより独自データ拡張。
Qwen2.5-32B-Instructによる独自合成データhttps://huggingface.co/Qwen/Qwen2.5-32B-Instruct
ELYZA-tasks-100のタスクを元に独自に簡単なタスクを定義をし、Qwen2.5-32B-Instructにより独自データを生成。