kaeru39 PRO
ryota39
AI & ML interests
LLM × RL
Recent Activity
liked
a model
4 days ago
nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16
liked
a model
7 days ago
nvidia/NitroGen
liked
a model
11 days ago
ByteDance/Ouro-2.6B-Thinking
Organizations
Local AI Hackathon#001
メタデータラボ様からの計算資源のご提供により構築したモデルおよびデータセットhttps://prtimes.jp/main/html/rd/p/000000008.000056944.html
English_to_Japanese Translator
LLMを用いた英日翻訳モデル
Corpus for DPO in Japanese
直接嗜好最適化のための日本語データセット
Classifier-Boosted Corpus
選好データ分類器によってスコア付けされたコーパス
math Corpus for Japanese
math RL for LLM
算術推論能力を検証するためのモデル
Local AI Hackathon#001
メタデータラボ様からの計算資源のご提供により構築したモデルおよびデータセットhttps://prtimes.jp/main/html/rd/p/000000008.000056944.html
ChatVector
モデル間の重みの加減算のみで構築した日本語LLM
English_to_Japanese Translator
LLMを用いた英日翻訳モデル
Reward Model for Japanese
日本語データセットで報酬モデルを作る取り組み
Corpus for DPO in Japanese
直接嗜好最適化のための日本語データセット
Corpus for RLHF in Japanese
報酬モデルの学習のための日本語データセット
Classifier-Boosted Corpus
選好データ分類器によってスコア付けされたコーパス