CanIRun.ai 是一个免费网页工具,一键检测你的电脑配置,告诉你能本地跑哪些大语言模型(LLM)、跑得有多快,以及是否值得升级显卡。
一、核心定位
- 用途:解决 “我这台电脑能跑什么本地 AI 模型” 的问题,无需安装软件,浏览器直接用。
- 发布时间:2026 年 3 月(Hacker News 热门讨论工具)。
二、工作原理
- 用浏览器 WebGPU API 自动读取硬件:GPU 型号、显存、内存带宽、RAM 等。
- 基于模型参数大小、量化等级(Q4_K_M/Q8_0/F16 等)、显存需求,结合硬件带宽,自动计算可运行性与推理速度(token/s)。
- 数据来源:llama.cpp、Ollama、LM Studio 等主流本地推理工具库。
三、主要功能
- 自动硬件检测:Chrome/Edge 直接识别 GPU / 显存;Firefox 兼容性较差。
- 模型兼容性评级(S~F):
- S/A:流畅(≥20 token/s,对话无压力)
- B/C:可运行(5–20 token/s,轻度可用)
- D/F:不推荐(<5 token/s 或显存不足)
- 速度预估(token/s):直观判断是否够用。
- 多维度筛选:按模型大小、量化、任务类型、开源协议过滤。
- 模型对比(Compare):同一硬件下多模型并排对比,直观差异。
- 升级模拟:换不同显卡 / 显存,看能提升哪些模型的运行能力。
四、覆盖模型范围
- 轻量:0.8B~7B(如 Mistral-7B、Llama 2-7B)
- 中端:13B~34B(如 Llama 3-70B、Phi-3)
- 高端:70B~1T MoE(如 GPT-4 级别的巨型模型,仅高端工作站 / 数据中心可跑)
五、使用场景
- 本地 AI 新手:避免盲目下载几十 GB 模型 “碰运气”。
- 硬件升级决策:判断是否需要加显存 / 换显卡。
- 模型选型:快速找到适合自己电脑的 LLM。
数据统计
相关导航
没有相关内容!
暂无评论...
