企业财报自动抓取系统

企业财报自动抓取系统

基于爬虫技术的定向抓取上市企业财报数据的大数据分析整合系统。

爬虫 自动归类 聚类 人工智能 大数据

 

企业财报自动抓取系统

基于爬虫技术的定向抓取上市企业财报数据的大数据分析整合系统。

一套做数据抓取入数据库,实现计算的决策引擎工具,业务人员可以自由条件判断组合计算,主要包含四大模块:1)财报辨伪评分 2)流水交叉核验 3)其它交叉核验 4)企业财务行 为评分,最终返回评分和风险提示到系统界面供客户参考。

1、 登录查询界面

PC 端 后台通过邮箱号或手机号等生成账号,交由客户自己安装,远程控制客户软件使用次数或时间权限。 页面分为两大类:上市公司&非上市公司

上市公司——客户输入需查询企业的股票代码/名称关键字 非上市公司——客户按选择购买的业务模块,手工输入选项(总计约 8 项),对接客户数据库,或客户上传 Excel 格式财报、银行流水,系统根据抓取的数据转换成数据库格式,将抓取结果呈现给客户,客户根据提示确认或 修改转换结果。

网站端页面要素:

上市公司——客户输入需查询企业的股票代码/名称关键字 非上市公司——客户按选择购买的业务模块,手工输入选项(总计约 8 项),对接客户数据库,或客户上传 Excel 格式财报、银行流水,系统根据抓取的数据转换成数据库格式,将抓取结果呈现给客户,客户根据提示确认或 修改转换结果。

2、 电子合同、支付界面

PC 端——直销获客的机构客户,按线下合同付费,无需支付按钮。 网站端——网络获客,签署电子合同,设置付费选项,可灵活配置选择业务模块、时间、价格、折扣等如:单 笔价格、打包价格、年收费、半年收费、季度收费(后续开发时附上详细定价表)。

3、 结果界面 要素:

 1)财报辨伪评分、造假风险等级、造假风险提示; 

 2)流水交叉核验指标项,指标项对应风险提示; 

3)其它交叉核验指标项,指标项对应风险提示;

4)企业财务行为评分、财务行为风险等级、财务行为风险提示;

内部流程控制界面

1、数据抓取

上市公司——同花顺官网或同类型网站数据(页面为:行业分析-详细报告、财务分析-财务报表)对接,获取 所有上市公司各年度和最新季度财务三表(资产负债表、利润表、现金流量表)、所属行业分类、板块。

非上市公司——客户手工输入选项(总计约 8 项),对接客户数据库,或客户上传 Excel 格式财报、银行流水。

(后续开发时附上详细原始数据要求 Excel 表格)

2、数据简单计算的决策引擎工具

实现原始数据项(约 70 项)之间的连续加减乘除、增长比率、条件判断等自由组合、配置参数,方便模型增减 调整。设置相应的图形界面供业务人员操作/计算模型,仅将运算结果和风险提示返回系统。

3、后台用户管理 后台通过邮箱号或手机号等生成账号,交由客户自己安装,远程控制客户软件使用次数或时间权限。后台显示客户 信息统计,如查询次数,使用时间,将到期客户提醒,到期规则做成工具可灵活调整,如试用期使用次数、时间,或使用时间根据合同调整。

4、收费管理后台控制 可灵活配置选择业务模块、时间、价格、折扣等如:单笔价格、打包价格、年收费、半年收费、季度收费(后续开 发时附上详细定价表)。

爬虫 自动归类 聚类 人工智能 大数据