カテゴリ
技術
LLM 記事
大規模言語モデルの最新の手法、ツール、研究動向をチェックしましょう。私たちのブログでは、データサイエンス、活用事例、責任あるAIの実践について取り上げています。
その他の技術:
2人以上をトレーニングしますか?DataCamp for Businessを試す
インタラクションモデル:TML-Interaction-Small の強み
Mira Murati の Thinking Machines Lab は、同時に「聞いて話す」モデルを構築しました。本記事ではその機能を分解し、GPT-Realtime-2 と比較ベンチマークします。
2026年5月13日
AI学習ロードマップ2026:初心者に最適なリソース
Pythonの基礎からLLMやエージェント型AIまで、AIをゼロから学ぶための最適なコースとリソースを網羅した体系的なAI学習ロードマップ。
2026年5月13日
SubQ AI 徹底解説:1200万トークンのコンテキストウィンドウ LLM はどれほど優れているのか
Subquadratic の SubQ モデルは、1200万トークンのコンテキストウィンドウ、52倍の効率、そしてフロンティア級の性能を主張します。ここでは SSA アーキテクチャの仕組みと、ベンチマークが実際に示すものを解説します。
2026年5月12日
GPT-5.5 と Gemini 3.1 Pro の比較:どのフロンティアモデルを使うべきか
OpenAI の GPT-5.5 と Google の Gemini 3.1 Pro を、コーディング、推論、エージェント系ベンチマーク、料金、コンテキスト上限で比較し、最適なモデル選びを支援します。
2026年5月11日
DeepSeek V4:機能、ベンチマーク、比較
DeepSeek V4 の機能、価格、100 万トークン文脈効率を紹介。V4 Pro と Flash のベンチマークを、GPT-5.5 や Opus 4.7 といった最前線モデルと比較します。
2026年5月4日
DeepSeek V4 Flash vs GPT-5.4 Mini・Nano:最適な軽量LLMはどれ?
DeepSeek V4 Flash、GPT-5.4 Mini、GPT-5.4 Nanoを、ベンチマーク、価格、実運用のユースケースで正面比較します。
2026年5月4日
Claude Opus 4.7 と DeepSeek V4:どちらのモデルを使うべき?
Anthropic の Claude Opus 4.7 と DeepSeek V4 をベンチマーク、料金、エージェント型コーディング、推論で比較。ワークフローに最適なモデルを見つけましょう。
2026年4月30日
Claude Opus 4.7 と GPT-5.5 の比較:最先端モデルはどちらが最適か
OpenAI の GPT-5.5 と Anthropic の Claude Opus 4.7 を、コーディング、推論、ビジョン、ツール使用、価格で正面比較します。
2026年4月28日
Claude Opus 4.7 と Gemini 3.1 Pro の比較:どちらのモデルが優れている?
Opus 4.7 と Gemini 3.1 Pro を、コーディング、推論、エージェント系ベンチマーク、価格、コンテキスト上限で比較し、最適なモデル選びを支援します。
2026年4月27日
GPT-5.4:ネイティブなコンピューター操作、100万トークンのコンテキスト、ツール検索
OpenAIの最新リリースであるGPT-5.4は、ネイティブなコンピューター操作、拡張されたコンテキスト、そして現実の成果物へのより明確なフォーカスを導入します。
2026年4月24日