即时 >新手学Python体会

   转瞬即逝,一眨眼就到了期末,这学期的爬虫课程也在线上看完了,对我来说受益匪浅,学到了很多也知道的网络爬虫的等等。

第一课时ppt上,了解到网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到达到系统的某一条件时停止。另外,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;对于聚焦爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导

随后又知道if和if-else的区别:if 块和 else if 块本质上是互斥的!也就是说,一旦语句1得到了执行,程序会跳过 else if 块else if 块中的判断语句以及语句2一定会被跳过;同时语句2的执行也暗含了条件1判断失败和语句1没有执行;当然还有第3个情况,就是条件1和条件2都判断失败,语句1和语句2都没有得到执行。

然后又学习了字符串,字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s="a1a2···an"(n>=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。通常以串的整体作为操作对象,如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要条件是:长度相等,并且各个对应位置上的字符都相等。设p、q是两个串,求q在p中首次出现的位置的运算叫做模式匹配。串的两种最基本的存储方式是顺序存储方式和链接存储方式。

再来学了元组,是一个与列表类似的集合,不过由于元组是不可改变的,所以不能对元组完成排序,也不能追加和删除元素。 一旦用一组元素创建一个元组,它就会一直保持不变。还有函数,数字运算:abs、divmod、max、min、pow、round、sum;类型转换:bool、int、float、complex、str、bytearray、bytes、memoryview等等还有传递,函数传递参数的形式主要有以下五种,分别为位置传递,关键字传递,默认值传递,不定参数传递(包裹传递)和解包裹传递。

列表是是一种有序和可更改的集合。

最后,感谢Python这门课程,让我学习了更多的知识。知识的学习都是由浅入深的,先掌握基础,再根据自己的目标去练习,才会有效果。不要三心二意,今天学十分钟爬虫,明天学5钟机器学习什么的。不断练习,不断练习。量变到质变的过程。只有在敲代码的过程中才会遇到自己的问题,解决了就提升了。


相关推荐