标签归档:Web

Chrome Google搜索结果直接跳转扩展

前段时间Google hosts无法正常使用时写来自己用的一个Chrome扩展,主要功能是解决打开Google搜索结果时,由于经过Google跳转而导致网页被屏蔽的问题。

由于扩展只是自己个人使用,所以做得比较粗糙,还有一些小bug。

扩展清单文件(manifest.json):

{
  "name": "GoogleDirectLink",
  "version": "1.0",
  "description": "帮助访问由于某些原因而不能访问的Google搜索结果",
  "background": { "scripts": ["background.js"] },
  "browser_action" :
  {
    "default_icon" : "icon-19.png",
    "default_title" : "非Google搜索结果页"
  },
  "permissions" : [
    "tabs", "http://*/*", "https://*/*"
  ],
  "icons" : {
    "48" : "icon-48.png",
    "128" : 

Python使用urllib与BeautifulSoup下载并解析HTML

导入相关模块

import urllib.request
from bs4 import BeautifulSoup
from bs4 import SoupStrainer

下载并读取HTML内容

response = urllib.request.urlopen('http://www.baidu.com')
html_doc = response.read()

创建BeautifulSoup部分解析过滤器

only_nv_id = SoupStrainer(id='nv')

解析并输出百度nv中的文本内容

print(BeautifulSoup(html_doc, "html.parser", parse_only=only_nv_id).get_text())
新 闻 网 页 贴 吧 知 道 音 乐 图 片 视 频