资源介绍
地级市政府工作报告是地级市人民政府向同级人民代表大会所作的年度综合性、权威性政务报告。主要包括上一年度工作回顾,当年经济社会发展总体要求和主要预期目标,当年的重点工作任务等内容
团队整理了2002-2025年间,共280多个地级市的政府工作报告文本,将原始文本保存为txt格式,同时也整理了csv格式的面板数据,便于研究人员使用
一、数据介绍
数据名称:中国地级市政府工作报告
数据范围:地级以上城市
时间范围:2002-2025年
样本数量:5989条
数据格式:包括txt文件、文本面板数据
数据来源:地方政府网站
二、整理说明
从地方政府网爬取工作报告,保存txt版
将报告文本整理为一张表格,保存csv版
去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
保留中英文、数字,统计全文文本总长度
保存原始文本、文本长度、词频总数
三、数据指标
年份
地区等级
地区
报告全文
文本总长度
仅中英文-文本总长度
文本总词频-全模式
文本总词频-精确模式
四、数据概览


资源获取方式

长按上方二维码关注211统计课堂公众号
后台回复关键词 “数据分享”获取免费领取方式!
快捷查找211数据库文章可将“数据清单”文档链接
复制到浏览器:https://kdocs.cn/l/csS0IAGVim3a
我们将不定期更新数据,小伙伴可加本公号“星标”或定期来本公号查找,
关注211统计课堂
如需加入SCI、CSCD论文、课题等科研数据统计分析交流群,请加小编微信:tj211005,小编拉您进群。