数据分析入门之PYTHON语法

1.学习python的目的
由于大数据和人工智能的出现,对数据分析的需求日益增多,python是数据分析主要语言之一。因此学好python对数据分析以及后续的人工智能学习打下坚实的基础。未来如果从事数据分析、机器学习、人工智能相关工作,需要好好学习python这门语言。
2.学习数据分析的环境
安装anaconda,再安装jupyter notebook。anaconda为包管理器和环境管理器,jupyter notebook可以将数据分析报告的代码和图片组合到一个web文档中。
anaconda的安装和使用,可以参考链接:
https://zhihu/question/58033789/answer/254673663
jupyter
notebook的安装和使用,可以参考链接:
https://zhihu/question/46309360/answer/254638807
3.python基本语法
3.1注释
注释方便理解代码,可以为任意内容,程序不会运行注释。一般有两种注释方法:
(1) 注释方法1:一行文字注释,可以在注释前面加#
(2) 注释方法2:几行文字注释,可以用‘‘‘ ’’’来包含几行注释文字
3.2变量
在程序中变量为数字或者是任何数据类型,用一个变量名来表示。变量名的起名前半部分名称代表数据的意义,后半部分名称代表数据的类型。在python中数字不能为变量名的开头,同时python中对大小写敏感的。
3.3数据类型
python中的数据类型分为5大类:
(1) 字符串
(2) 数字
(3) 容器
(4) 布尔
(5) none
3.3.1数据类型:字符串
python中的字符串用单引号(')或双引号()括起来
3.3.2数据类型:数值
python3 支持int(整数)、float(浮点数)、complex(复数)
3.3.3数据类型:容器
3.3.3.1数据类型:容器-列表
list(列表) 是 python 中使用最频繁的数据类型。
列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表(所谓嵌套)。
列表是写在方括号([])之间、用逗号分隔开的元素列表。
列表涉及到常用操作:增加,删除,查询,修改
增加:
删除:
查询:
修改:
3.3.3.2数据类型:容器-集合(sets)
集合(set)是一个无序不重复元素的序列。
集合涉及到常用操作:增加,删除,查询,修改
增加
删除
查询
修改
3.3.3.3数据类型:容器-字典(dic)
字典是一种映射类型,字典用{ }标识,它是一个无序的键(key) : 值(value)对集合。
键(key)必须使用不可变类型,在同一个字典中,键(key)必须是唯一的。
列表是有序的对象结合,字典是无序的对象集合。
增加
删除
查询
修改
3.3.3.4数据类型:布尔类型
布尔类型分为‘true’或者‘false’
3.3.3.5数据类型:空值
4.条件判断
python条判断语句是通过一条或多条语句的执行结果(true或者false)来决定执行的代码块。
基本语法为:简单判断if
……else……
多个条件判断if……elif……else……
比较符号 : 小于
小于等于 大于等于>= 不等于!= 等于==
逻辑比较 : and 并且
or或 not非
简单判断:
多重判断:
5.循环
python for循环可以遍历任何序列的项目,如一个列表或者一个字符串。
没有循环的情况下,需要每个元素打印一遍。
有循环后,循环会自动遍历每个元素。
清洗字典中的数据
跳出循环
退出循环
6.函数
函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。
函数能提高应用的模块性,和代码的重复利用率。你已经知道python提供了许多内建函数,比如input()。但你也可以自己创建函数,这被叫做用户自定义函数
定义函数
使用函数
函数参数:不可变数据类型
字符串、数字、元祖为3种不可变数据类型,其他的都是可变的数据类型
函数参数:可变数据类型
变量作用域
python的作用域一共有2种:全局作用域,局部作用域。
定义在函数内部的变量拥有一个局部作用域,定义在函数外的拥有全局作用域。
局部变量只能在其被声明的函数内部访问,而全局变量可以在整个程序范围内访问。
7.数据结构
常用的数据结构有:队列、栈、排序字典、计数
队列的特点是先进先出,后进后出
栈的数据结构特点是先进后出,后进先出。
排序字典
由于字典内定义的元素是无序的,用排序字典可以对字典内部的元素进行排序。
计数器counter
总结:
学习python,对于每行代码还是需要去实践一遍,很多代码看似简单,但是实践起来会有或多或少的错误,很赞同猴子老师的一句话,编程其实是一门手艺活,只有多练才能熟练掌握。