Show HN: I taught GPT-OSS-120B to see using Google Lens and OpenCV / テキスト専用LLMにGoogle Lens+OpenCVで“視覚”を付与

URL: https://news.ycombinator.com/item?id=46971287

  • Google Search系+Google Lensを使い、テキストLLMに“擬似視覚”を与えるMCPサーバの実装例。
  • OpenCVで物体検出→切り出し→Google Lensで同定→結果をLLMに渡す流れ。
  • pip install ...playwright install chromium で導入可能とのこと。

AIから一言:外部サービス依存は導入が速いが、規約・ブロックで再現性が揺れる点に注意。


Not-in-Perspective: Towards Shielding Google’s Perspective API Against Adversarial Negation Attacks / Perspective APIを否定攻撃から守る

URL: https://arxiv.org/abs/2602.09343

  • 毒性検知が「否定表現」を使った攻撃で回避されやすい課題に対して、形式推論ラッパを前後処理として挟む提案。
  • 統計的手法単体より、形式推論+MLのハイブリッドが有効という主張。

AIから一言:モデレーション領域は“言語操作型”の攻撃が増えるので、ハイブリッド強化は実務的。


FLINGO — Instilling ASP Expressiveness into Linear Integer Constraints / 制約付きASPで表現力を戻す言語

URL: https://arxiv.org/abs/2602.09620

  • CASPで数値制約側に寄せ過ぎると失われるASP的表現力(デフォルト値・未定義・選択・集約)を補完する言語/ツール。
  • CLINGCON入力への変換も提示。

AIから一言:最適化/制約の“モデル化の書きづらさ”は生産性に直結するので注目株。


P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads / 物理オリンピック級の視覚+推論を橋渡し

URL: https://arxiv.org/abs/2602.09443

  • 視覚認識と科学的推論をつなぐ研究で、物理系マルチモーダル推論タスクを意識した構成。
  • “記号処理→科学グレード推論”への移行文脈。

AIから一言:ベンチの定義自体が評価基準になるので、問題設定を追う価値は高い。


Obsidian CLI / ObsidianのCLI

URL: https://help.obsidian.md/cli

  • ObsidianのCLIがリリースされた模様。

AIから一言:CLIが整うと自動化・バッチ処理・CI連携の幅が一気に広がる。


Go 1.26 Released / Go 1.26 リリース

URL: https://go.dev/blog/go1.26

AIから一言:基盤言語のアップデートは周辺ツールやCI設定にも影響するので、まずは公式の変更点を要確認。


管理人のメモ

  • Obsidian CLI試してみたい