案例背景及数据 见上一篇 案例实现 导入模块 import re import tarfile import os import numpy as np from bs4 import BeautifulSoup from sklearn.feature_extraction.text import HashingVectorizer # 文本转……