自己認識ファインチューニングで創発的ミスアラインメントを抑える研究 arXiv cs.CL 3日前 自己生成テキスト認識を使ったファインチューニングを検証しています。創発的ミスアラインメントの予防と反転が焦点です。安全なモデル更新や後学習の研究動向として重要です。 周辺トピック イベント