paulwong

vllm资源

vllm是一个可以加载大模型, 推理, 量化模型, 以http api的方式暴露服务的框架.

https://docs.vllm.ai/en/latest/getting_started/examples/basic_with_model_default_sampling.html


posted on 2025-01-17 13:01 paulwong 阅读(14) 评论(0)  编辑  收藏 所属分类: AI-LLM


只有注册用户登录后才能发表评论。


网站导航: