头条详情的反爬虫是利用js做的window.location.reload()来做的相当于重定向可以在linux安装谷歌浏览器和谷歌驱动利用pyvirtualdisplay模块可以实现无界面的(其实是有界面 只是隐藏起来了 如果直接用无头浏览器没法处理重定向因为只会返回第一次加载的界面)加载from selenium import webdriver
import time
from selenium.webdriver.chrome.opt
适用于主观题(解答之类的)前面也是利用结巴分词把多个学生的同一个问题连同正确答案转为词向量,然后利用SVD分解,取出前几个指定数量的奇异值并且还原成新的向量,然后求解相似度乘以总分就得到某个答案的分数main.py# coding:utf-8
import jieba
import codecs
from numpy import *
import re
from sklearn.feature_ext