CodeShell:性能最强的7B代码基座大模型
北京大学软件工程国家工程研究中心知识计算实验室联合四川天府银行AI实验室,正式开源70亿参数的代码大模型CodeShell,成为同等规模最强代码基座。与此同时,团队将软件开发代码助手的完整解决方案全部开源,人手一个本地化轻量化的智能代码助手的时代已经来临!
CodeShell代码:https://github.com/WisdomShell/codeshell
CodeShell基座模型:https://huggingface.co/WisdomShell/CodeShell-7B
代码助手VSCode插件:https://github.com/WisdomShell/codeshell-vscode
具体来说,CodeShell-7B基于5000亿Tokens进行了冷启动训练,上下文窗口长度为8192。
在权威的代码评估基准(HumanEval和MBPP)上,CodeShell取得同等规模最好的性能,超过了CodeLlama-7B和StarCodeBase-7B。
与此同时,同CodeShell-7B配套的量化与本地部署方案,以及支持VSCode与JetBrains IDE的插件也全部开源,为新一代智能代码助手提供了轻量高效的全栈开源解决方案。
CodeShell模型和插件的相关代码已经在Github发布,并严格遵循Apache 2.0开源协议,模型在HuggingFace平台发布,支持商用。
对众多开发者而言,即便拥有功能强大的代码助手模型,其应用门槛仍然过高。
为此,CodeShell团队诚意满满地把IDE插件也开源了!
IDE插件目前支持VSCode和IntelliJ IDEA,适用于各种主流编程语言。
在开发过程中,CodeShell代码助手插件提供了两种模式,即专注模式和交互模式,两种模式相互协同,共同提升开发效率。
在专注模式下,通过对当前项目代码的分析,提供代码提示与补全功能,从而提高编程效率。
在交互模式下,IDE插件通过向代码助手大模型发送特定的交互Prompt和用户输入,可提供丰富的功能,来看几个实例。
智能问答:在编程过程中直接向代码助手模型提出问题,无需切换至其他界面,支持对话与编程两种场景无缝融合。
代码解释:使用自然语言解释代码的运行过程,让开发者更好地理解代码的结构和逻辑。
安全检测:检测代码中的潜在安全风险,如可能出现的SQL注入、跨站脚本攻击等,帮助排查安全性风险。
其它功能还包括:
自动添加注释——为代码自动生成描述其功能、参数及返回值等相关信息的注释;
代码优化与审计——对代码进行深入分析,检测潜在的错误、冗余代码和性能瓶颈,并为开发者提供相应的修复建议;
代码格式检查——自动检测代码的排版和格式问题,发现潜在的不规范现象;
性能评估——对代码的性能风险进行评估,发现潜在的性能瓶颈,为优化代码性能提供支持;
测试用例生成——基于代码逻辑,自动创建测试用例,以辅助进行代码测试和验证,确保代码的正确性和稳定性。
开发者下载模型,在本地做简单操作和配置,即可马上体验。