朝倉陽

AIエージェント

AIのPRをレビューするとは、何を判断することか

エージェントが出したPRを、あなたはどう読むか。GitHub のブログ記事 Agent pull requests are everywhere. Here's how to review them. は、AI エージェントが PR を出す...
LLM・基盤モデル

AIが「孤独な相談」を誰かにつなぐ日——ChatGPT Trusted Contact の可能性

AIが孤独な相談相手から、人間のネットワークへの橋渡し役になれるとしたら——。OpenAIは Introducing Trusted Contact in ChatGPT を発表した。ChatGPTが深刻な自傷・自殺リスクに関する懸念を検知...
AIエージェント

トークン効率がエージェントの実用性を分ける

AIエージェントが複数のツールを呼び出しながらタスクをこなす場面では、1回の完了に膨大なトークンが消費される。これは単なるコストの問題ではない。トークン消費が増えるほど速度は落ち、精度の安定性も揺らぐ。GitHub は Improving ...
LLM・基盤モデル

Codexで変わるのは速度か、それとも役割か

「AIで開発が速くなる」という話は珍しくなくなった。だが、Simplexの事例が示すのは速度の話だけではないかもしれない。Simplex rethinks software development with CodexSimplexはCha...
LLM・基盤モデル

ChatGPTの広告実験が問うこと——「無料AI」を持続させる設計

ChatGPTに広告が入ると聞けば、多くの人は反射的に「体験が落ちる」と感じるかもしれない。だが発表の中身を読むと、問うべき論点はそこではないとわかる。Testing ads in ChatGPTOpenAIはChatGPTへの広告テストを...
生成AI

音声AIの設計が変わる——「つなぐ」から「考えさせる」へ

Advancing voice intelligence with new models in the APIOpenAI が音声向けの新リアルタイムモデルを API で提供開始した。リアルタイムの推論・翻訳・文字起こしを単一モデルで処理で...
LLM・基盤モデル

守る側が frontier モデルを使えると何が変わるか

OpenAI が発表した Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber は、Trusted Access for Cyber プログラムを GPT-5.5 お...
AIエージェント

「また話したい」と思われるAIに、何が足りなかったか

AIカスタマーサービスは長年、「仕方なく使うもの」だった。メニューを繰り返し読み上げるボット、意図を理解しない応答、最終的に人間へのエスカレートで終わる体験。顧客にとってそれは選択肢ではなく、障害だった。Parloa builds serv...
LLM・基盤モデル

RL学習が乱れたのは、アルゴリズムではなくエンジンだった

vLLM V0 to V1: Correctness Before Corrections in RLServiceNow AIが公開したこのレポートは、vLLM V1への移行でRL学習パイプラインに生じた指標の乱れを記録したものです。cl...
LLM・基盤モデル

推論エンジンの正しさを先に——vLLM V1移行が示したRL開発の優先順位

ServiceNow AI が公開した vLLM V0 to V1: Correctness Before Corrections in RL は、強化学習パイプラインにおける推論エンジンの移行録だ。rollout 生成に vLLM を使う...