分类:知识大全时间:2023-02-04 09:13作者:未知编辑:猜谜语
关于【降姓氏怎么读】,降做姓氏怎么读,今天犇犇小编给您分享一下,假如对您有所帮助别忘了关注本站哦。
内容导航:1、降姓氏怎么读2、Python爬虫学习笔记(一)本系列记录自己学习Python编程的历程....如有错误,望各位大神不吝赐教。
这是爬虫必须具备的基本库,通过pip安装最为方便
在CMD下输入:
pip install requests
直接上代码
import requests #导入requests库url = 'http://www.baidu.com're = requests.get(url)#对百度发起哀求print (re.text)#打印百度网页的源代码
直接运行后,会得到如下的结果:
!DOCTYPE html!--STATUS OK--html headmeta http-equiv=content-type content=text/html;charset=utf-8meta http-equiv=X-UA-Compatible content=IE=Edgemeta content=always name=referrerlink rel=stylesheet type=text/css href=http://s1.bdstatic.com/r/www/cache/bdorz/baidu.min.csstitleç¾åº¦ä¸ä¸ï¼ä½ å°±ç¥é/title/head body link=#0000cc div id=wrapper div id=head div class=head_wrapper div class=s_form div class=s_form_wrapper div id=lg img hidefocus=true src=//www.baidu.com/img/bd_logo1.png width=270 height=129 /div form id=form name=f action=//www.baidu.com/s class=fm input type=hidden name=bdorz_come value=1 input type=hidden name=ie value=utf-8 input type=hidden name=f value=8 input type=hidden name=rsv_bp value=1 input type=hidden name=rsv_idx value=1 input type=hidden name=tn value=baiduspaninput id=kw name=wd class=s_ipt value maxlength=255 autocomplete=off autofocus/spanspaninput type=submit id=su value=ç¾åº¦ä¸ä¸/span /form /div /div div id=u1 a href=http://news.baidu.com name=tj_trnews class=mnavæ°é»/a a href=http://www.hao123.com name=tj_trhao123 class=mnavhao123/a a href=http://map.baidu.com name=tj_trmap class=mnavå°å¾/a a href=http://v.baidu.com name=tj_trvideo class=mnavè§é¢/a a href=http://tieba.baidu.com name=tj_trtieba class=mnavè´´å§/a noscript a href=http://www.baidu.com/bdorz/login.gif?logintpl=mnu=http%3A%2F%2Fwww.baidu.com%2f%3fbdorz_come%3d1 name=tj_login class=lbç»å½/a /noscript scriptdocument.write('a href="http://www.baidu.com/bdorz/login.gif?logintpl=mnu='+ encodeURIComponent(window.location.href+ (window.location.search === "" ? "?" : "")+ "bdorz_come=1")+ '" name="tj_login"ç»å½/a');/script a href=//www.baidu.com/more/ name=tj_briicon class=bri style="display: block;"æ´å¤äº§å/a /div /div /div div id=ftCon div id=ftConw p id=lh a href=http://home.baidu.comå ³äºç¾åº¦/a a href=http://ir.baidu.comAbout Baidu/a /p p id=cp©2017 Baidu a href=http://www.baidu.com/duty/使ç¨ç¾åº¦åå¿ è¯»/a a href=http://jianyi.baidu.com/ class=cp-feedbackæè§åé¦/a 京ICPè¯030173å· img src=//www.baidu.com/img/gs.gif /p /div /div /div /body /html
你会发现,这个网页源代码除了英文以外,还有一些乱码根本看不懂,这是因为编码的问题。
在网页源代码的第二行可以看到,其采用的是“UTF-8”的编码,海内常用的还有“GB2312”、“GBK”等等。我们要在源代码里面找到其编码格式,在爬取到数据后需要对其进行解码才可以,因此,我们在爬虫代码里面得加入一句。
import requestsurl = 'http://www.baidu.com're = requests.get(url)re.encoding ='utf-8' #这里就是对源代码进行解码,是什么编码就在引号里写什么编码print (re.text)
再次运行我们会得到:
本文要害词:降姓氏读音,降做姓氏怎么读,降姓氏怎么读拼音,降姓氏怎么读音,中国最稀有的姓氏全国仅一人。这就是关于《降姓氏怎么读,降做姓氏怎么读(Python爬虫学习笔记)》的所有内容,希望对您能有所帮助!