
工程项目


哈工大SCIR 发布珠算-SQL
珠算-SQL是由SCIR实验室开发的Text-to-SQL(文本转SQL)系统,旨在将自然语言查询自动转换为SQL查询语句,为用户提供高效、便捷的数据库交互体验。
哈工大发布“珠算”代码大模型
目前开源代码大模型提升编程能力的同时会严重损害通用语言能力。为此,哈工大赛尔实验室推出了“珠算”代码大模型,以2.7B参数在代码与通用语言平均性能上超越了3B及以下代码大模型,希望通过开放权重、训练细节及微调适配平台与插件,助力开源社区发展
哈工大开源“活字3.5”对话大模型
哈工大社会计算与信息检索研究中心(HIT-SCIR)发布了活字3.5对话大模型,新版模型在中英文知识、数学推理、代码生成、指令遵循能力、内容安全性等诸多方面实现了性能提升。我们希望该开源项目能够有助于推动自然语言处理技术的研究和应用。
哈工大开源“活字”对话大模型3.0版本
哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)近期推出了最新成果——活字3.0,致力于为自然语言处理的研究和实际应用提供更多可能性和选择。
HIT-SCIR发布首个中文扩词表增量预训练混合专家模型Chinese-Mixtral-8x7B
哈工大社会计算与信息检索研究中心(HIT-SCIR)基于Mixtral-8x7B进行了中文扩词表增量预训练。扩充后的词表显著提高了模型对中文的编解码效率,通过大规模开源语料对扩词表模型进行增量预训练,使模型具备了强大的中文生成和理解能力。
哈工大开源“活字”对话大模型
哈工大发布开源可商用的大规模预训练语言模型活字1.0和活字2.0。
哈工大自然语言处理研究所公开《ChatGPT调研报告》,内测哈工大“活字”对话大模型
2023年3月6日,哈工大自然语言处理研究所 ( HIT-NLP, since 1979 ) 师生联合撰写出《ChatGPT调研报告》(84页),对“大模型”技术进行了系统的介绍。此外,哈工大自然语言处理研究所已经研制出哈工大“活字”对话大模型(通用),目前处于研究所内测阶段。推出 v4.2 版本!.jpg)
语言技术平台(LTP)推出 v4.2 版本!
语言技术平台(LTP)推出 v4.2 版本,此次升级主要提升了分词等常用任务的推理速度、增加了平台的易用性等。
LTP 4.0!单模型完成6项自然语言处理任务
语言技术平台(Language Technology Platform, LTP)是哈工大社会计算与信息检索研究中心(HIT-SCIR)历时多年研发的一整套高效、高精度的中文自然语言处理开源基础技术平台。该平台集词法分析(分词、词性标注、命...
语言技术平台(LTP)有新家啦!
语言技术平台(LTP)有新家了:http://ltp.ai/ 欢迎大家访问