杭州电子科技大学吴国华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利用于小说场景文本的分割方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115408488B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211020489.X,技术领域涉及:G06F16/31;该发明授权用于小说场景文本的分割方法及系统是由吴国华;王冲;王玉娟;张祯;袁理锋;王秋华;毛宗庆设计研发完成,并于2022-08-24向国家知识产权局提交的专利申请。
本用于小说场景文本的分割方法及系统在说明书摘要公布了:本发明属于自然语言处理技术领域,具体涉及用于小说场景文本的分割方法及系统。方法包括如下步骤S1,场景实体提取模型训练;S2,场景分割策略配置;S3,段落对象集合初始化;S4,场景实体提取;S5,场景边界确定;S6,场景抽取;S7,剧幕生成;S8,结束判定。本发明具有能够解决人工改编剧本耗时长、场景不一致的问题,且大幅降低进一步改编工作量的特点。
本发明授权用于小说场景文本的分割方法及系统在权利要求书中公布了:1.用于小说场景文本的分割方法,其特征在于,包括如下步骤: S1,场景实体提取模型训练: 获取不同类别小说文本,制作训练数据集,训练场景实体提取模型; S2,场景分割策略配置: 配置场景分割策略,获取对应的分割依据特征值; S3,段落对象集合初始化: 遍历小说文本,初始化段落对象集合; S4,场景实体提取: 遍历小说文本,提取小说的场景实体集合,更新段落对象集合; S5,场景边界确定: 根据段落对象集合确定场景的边界,得到边界点索引值; S6,场景抽取: 根据边界点索引值以及段落对象集合,抽取对应的原始段落文本与全文段落索引,生成场景原文,并更新段落对象集合; S7,剧幕生成: 将场景原文进行结构化,生成剧幕场景脚本; S8,结束判定: 判断是否完成全部场景抽取,若是,则输出全部剧幕场景脚本,否则返回步骤S4; 步骤S1包括如下步骤: S11,获取不同类别小说文本,制作训练数据集,对小说中的对象进行BIO标注,其中B代表场景实体的开头字符,I代表场景实体的中间或结尾字符,O代表不属于场景实体的字符; S12,根据训练数据集,训练基于机器学习的场景实体提取模型,用于自动识别输入文本中的场景实体; 步骤S3包括如下步骤: S31,小说文本预处理: 所述预处理包括索引标注、符号处理、分词、去停用词、场次计数器初始化; S32,段落对象初始化: 初始化段落对象集合,将预处理里后的文本段落及对应的全文段落索引值存储到段落对象; S33,分割依据特征值检测: 判断小说文本中是否含有分割依据特征值,并更新段落对象中对应的分割特征标志; 所述分割特征标志为根据对应原始段落文本是否含有分割依据特征值而设置的状态标志值; 步骤S5包括如下步骤: S51,场景相似度计算: 根据分割依据特征值选取段落对象,并依次计算各个段落对象的场景实体集合相似度; S52,场景边界判定: 通过比较步骤S51中获得的相似度值与设定阈值的大小,判定是否为场景边界;若判断结果为是,记录边界点索引值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市杭州经济技术开发区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励