本脚本通过查找页面上的文本节点,收集全部文字,然后去重处理
再将全部文本按200个字符的大小切割成块
与网站收集的常见错别字比对
再分批通过百度的nlp接口进行纠错处理
结果汇总成json返回给前端
前端脚本根据文本所在位置渲染出错别字提示