import re
import jieba
doc1 = """曝甜瓜和篮网球员一起训练 新赛季有望加入篮网?:自从上赛季在火箭阅历了失败后,安东尼一直无人问津,今年夏天关于他打不上球的话题也是被重复议论,依据最新资讯,安东尼最近正和篮网球员一起训练。
"""
doc2 = """周琦团队:感激新疆耐烦期待 新疆仍支撑周琦留洋:昨天,男篮国手周琦重返新疆男篮的事尘埃落定。尔后,周琦团队很快发表声明,新疆男篮仍会支撑周琦挑衅高程度联赛,而周琦之所以没有终究到欧洲去打球,是由于统筹国度队备战,没法抽身去加入试训。
"""
doc3 = """官宣!新疆宣告周琦回归 新赛季向总冠军发起冲击:北京时光8月13日,新疆篮球俱乐部官宣已与周琦完成签约。周琦将重新身披新疆队战袍,征战CBA赛场。新赛季周琦与球队向总冠军发起冲击。
"""
doc4 = """官宣!新疆宣告周琦回归 新赛季向总冠军发起冲击"""
doc5 = """欧联-武磊替补登场 西班牙人2-2总比分5-3进正赛_手机搜狐网,阵容方面,西班牙人主帅加耶戈排出4-3-3阵型,卡莱罗错误路易斯-洛佩斯出任中卫,达德尔、罗卡、格拉内罗组成"""
doc_complete = [doc1, doc2, doc3]
# doc_clean = [clean(doc).split() for doc in doc_complete]
def fenci(title):
corpus = ""
corpus = title
stopwords = [line.strip() for line in open("../data/stopWord.txt", "r", encoding="utf-8").readlines()]
r4 = "\【.*?】+|\《.*?》+|\#.*?#+|[0-9]+|[.!/_,$&%^*()<>+"""import re
import jieba
doc1 = """曝甜瓜和篮网球员一起训练