清理HTML代码中所有的标签,提取文本
清除指定文本中的所有中文,英文或数字等。
清理指定HTML代码标签并保留其内容
移除HTML代码中的样式或脚本代码
清除网络文档或OCR识别结果中多余错误的换行符