给 GLM-5.2 加上视觉能力:支持剪贴板直读的视觉 MCP

man9527 2026-06-29 18:21 1

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:



  • 我的帖子已经打上 开源推广 标签:

  • 我的开源项目完整开源,无未开源部分:

  • 我的开源项目已链接认可 LINUX DO 社区:

  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:

  • 以上选择我承诺是永久有效的,接受社区和佬友监督:




智谱官方有视觉 mcp 但是要订阅用户才行,智谱的套餐抢不到,更别说用 mcp 了


这个 MCP 适合订阅了其他 Coding Plan(火山、阿里这些)的佬友,把里面带的视觉模型接进来到进行识图


能干啥



  • 主打从剪贴板读取图片,截图完直接让 AI 分析,我感觉这可能是日常使用频率最高的场景,告诉模型从从剪贴板读取图片就行

  • 除了剪贴板,本地文件、URL、base64 也都支持


配置


MCP Host 里加一段,填上你自己的视觉模型 API:


{
"mcpServers": {
"clipboard-vision": {
"command": "npx",
"args": ["-y", "clipboard-vision-mcp"],
"env": {
"OPENAI_API_KEY": "你的 key",
"OPENAI_MODEL": "qwen-vl-plus",
"OPENAI_BASE_URL": "https://dashscope.aliyuncs.com/compatible-mode/v1"
}
}
}
}

说明



  • 只在 macOS 上测过,Windows 和 Linux 理论上能跑但没实测,出问题了跟我说


^-^ 项目地址:GitHub - llt22/image-recognition-mcp


好用的话点个 Star ^-^,有 Bug 直接提 Issue。

最新回复 (1)
  • 刘西瓜 06-29 21:30
    1

    佬效果如何?原理是识图模型给glm文字描述?

* 帖子来源Linux.do
返回