勤学教育网合作机构> > 广州叩丁狼教育欢迎您!

如何快速掌握python

广州叩丁狼教育logo
来源:广州叩丁狼教育

2022-04-15|已帮助:2550

进入 >

随着Python的进一步发展,越来越多的现成的Python的机器学习的算法已经发布出来。为了可以更好地运用这些机器学习的算法,我们有必要对Python有个初步的了解。以下是小编为你整理的如何快速掌握python

Python不同层级的语句之间间隔四个空格缩进, indentation。Python有比较严格的语法结构,需要不同层级的代码之间相差四个空格,不然就不能编译通过。

Python中输出到console是用print,然后接收键盘输入是用raw_input(),示例name = raw_input(What's your name?);


如何快速掌握python

写完程序之后,要用不同的输入来测试写的程序是否正确。

变量Variables,用于存储后续可能用到的数据

数据类型Data Type,包含数值和布尔值

注释,当行注释用#,多行注释"""开始"""结束,如下图所示

基本数学运算符,+,-,*,/

指数运算符,**

取余运算符,%

如何选择版本

Python 2.x 和 3.x 通常已经内置在现代 Linux 发行版中,你可以立刻使用它。你可以终端模拟器中输入 "python" 或 "python3"来进入 Python shell, 并输入 "quit()" 退出。

如果你希望在键入 "python" 时使用 Python 3.x 而不是 2.x,你可以像下面一样更改对应的符号链接:

顺便一提,有一点需要注意:尽管 Python 2.x 仍旧被使用,但它并不会被积极维护。因此,你可能要考虑像上面指示的那样来切换到 3.x。2.x 和 3.x 的语法有一些不同,我们会在这个系列文章中使用后者。

另一个在 Linux 中使用 Python 的方法是通过 IDLE (Python 集成开发环境),这是一个为编写 Python 代码而生的图形用户界面。在安装它之前,你最好查看一下适用于你的 Linux 发行版的 IDLE 可用版本。

然后,你可以像下面一样安装它:

$ sudo aptitude install idle-python3.2

安装成功后,你会看到 IDLE 的运行画面。它很像 Python shell,但是你可以用它做更多 Python shell 做不了的事。

集合的与操作

我们可以看到集合输出的效果会有一个set表示。

aaa = [1,2,3]bbb = [3,4,5,6]a_a = set(aaa)b_b = set(bbb)

集合中并集的表示:

k = a_a | b_b

print k


集合的与操作

使用一个| 线表示 ,求出2个数的并集。

vip = a_a.union(b_b) #并集print vip

集合中交集的表示 使用 ^ 表示求交集

k = a_a ^ b_b #交集合

print (a_a.intersection(b_b)) # 求交!!!!

集合中求出不同项目的结果

print (a_a.difference(b_b))

需要单独说明的是求的是自己的和他人的不同,不是两者一起的不同

编程新手的建议

选择一款合适的编程语言

事实上,Python、PHP、JAVA等常见的语言都可以用于编写网络爬虫,你首先需要选择一款合适的编程语言,这些编程语言各有优势,可以根据习惯进行选择。在此笔者推荐使用Python进行爬虫项目的编写,其优点是:简洁、掌握难度低。

掌握Python的一些基础爬虫模块

当然,在进行这一步之前,你应当先掌握Python的一些简单语法基础,然后才可以使用Python语言进行爬虫项目的开发。

在掌握了Python的语法基础之后,你需要重点掌握一个Python的关于爬虫开发的基础模块。这些模块有很多可以供你选择,比如urllib、requests等等,只需要精通一个基础模块即可,不必要都精通,因为都是大同小异的,在此推荐的是掌握urllib,当然你可以根据你的习惯进行选择。

深入掌握一款合适的表达式

学会了如何爬取网页内容之后,你还需要学会进行信息的提取。事实上,信息的提取你可以通过表达式进行实现,同样,有很多表达式可以供你选择使用,常见的有正则表达式、XPath表达式、BeautifulSoup等,这些表达式你没有必要都精通,同样,精通1-2个,其他的掌握即可,在此建议精通掌握正则表达式以及XPath表达式,其他的了解掌握即可。正则表达式可以处理的数据的范围比较大,简言之,就是能力比较强,XPath只能处理XML格式的数据,有些形式的数据不能处理,但XPath处理数据会比较快。

深入掌握抓包分析技术

事实上,很多网站都会做一些反爬措施,即不想让你爬到他的数据。最常见的反爬手段就是对数据进行隐藏处理,这个时候,你就无法直接爬取相关的数据了。作为爬虫方,如果需要在这种情况下获取数据,那么你需要对相应的数据进行抓包分析,然后再根据分析结果进行处理。一般推荐掌握的抓包分析工具是Fiddler,当然你也可以用其他的抓包分析工具,没有特别的要求。

精通一款爬虫框架

事实上,当你学习到这一步的时候,你已经入门了。

这个时候,你可能需要深入掌握一款爬虫框架,因为采用框架开发爬虫项目,效率会更加高,并且项目也会更加完善。

同样,你可以有很多爬虫框架进行选择,比如Scrapy、pySpider等等,一样的,你没必要每一种框架都精通,只需要精通一种框架即可,其他框架都是大同小异的,当你深入精通一款框架的时候,其他的框架了解一下事实上你便能轻松使用,在此推荐掌握Scrapy框架,当然你可以根据习惯进行选择。

以上是广州叩丁狼教育整理的如何快速掌握python全部内容。

热门推荐

更多
勤学培训网 python学习网 如何快速掌握python