据北大语言学实验室主任、北大中文系教授孔江平介绍,北大语言学实验室是集科研、教学、社会服务于一体的多学科交叉平台,其前身是1925年成立的北大语音乐律实验室。2021年12月,北大语言学实验室获批为教育部哲学社会科学实验室。在教育部经费的支持下,2022年春北大语言学实验室启动了“中华民族语言文字接触交融大数据模型建设”项目。该项目组织国内12所大学和科研机构的约20名专家的研究团队,近200名博士生和硕士生,对中华民族语言文字接触交融情况进行了大规模的田野调查,历经四年,初步完成了基础的调查工作和大型数据库建设。
此次发布的中华民族语言文字接触交融大数据模型,涉及中华民族语言文字接触交融大数据模型数据库的结构;语言活力的基础模型和算法——主要讨论语言活力的基本要素和分类方法;文字活力的基础模型和算法——主要讨论语言活力的基本要素和分类方法;中华民族语言文字接触交融大数据模型的内容和形式——主要讨论数据库的形式;中华民族语言文字接触交融通用语言词汇模型与算法——主要讨论词汇的语意结构、相关的基本算法和分类的方法;中华民族语言文字接触交融音位系统相似度模型与算法——主要讨论利用音位系统相似性来对语言进行分类。该大模型的建设,有助于让沉睡在田野中的即将消亡的声音活起来、传承下去。
网友评论更多
623包群平d
星巴克中国副总裁周海冰:正寻求在武汉开设华中首家星巴克非遗门店
2025/12/18 推荐
9858郑承慧448
绝缘失效零容忍!马波斯e.d.c.精...
2025/12/17 推荐
189莫素爽un
教育部:减少中小学日常考试测试频次
2025/12/16 不推荐