Skip to content

Releases: RIKEN-RCCS/Minutes

v1.1.0

05 Apr 23:54

Choose a tag to compare

変更内容

  • 推奨モデルを google/gemma-4-26B-A4B-it に更新(Qwen3-Swallow より高品質と評価)
  • requirements.txt 追加
  • README.md のモデル評価表を更新

gemma-4-26B-A4B-it の設定

vLLM 起動:
```bash
vllm serve google/gemma-4-26B-A4B-it
--dtype bfloat16 --max-model-len 32768
--gpu-memory-utilization 0.90 --reasoning-parser gemma4
```

generate_minutes_local.py:
```
--think --temperature 1.0 --max-tokens 16384
```