Python数据分析基础

发布时间: 2019-10-12 15:33:36 来源: 软件开发与爱好者 栏目: 科技新闻 点击: 240

Python数据分析基础,主要包括下面几个部分一、Python基础Python环境的安装官网下载之后傻瓜式安装,具体

Python数据分析基础,主要包括下面几个部分一、Python基础

Python环境的安装

官网下载之后傻瓜式安装,具体详细看廖雪峰官方网站Python安装https://www.liaoxuefeng.com/wiki/897692888725344/897692941155968

Python编辑工具PyCharm安装

官网下载之后傻瓜式安装,具体详细看菜鸟教程PyCharm安装教程https://www.runoob.com/w3cnote/pycharm-windows-install.html

【注意】:PyCharm首次使用需要激活,激活码太长,就不复制了,直接关注公众号,回复【PyCharm激活码即可】。

Python基础用法:

1.1 控制语句#一、for循环控制

for i in range(10):

print(i)

#二、while循环

sum = 0

n1 = 10

while n1 > 0:

sum += n1;

n1 -= 1;

print(sum)

# 三、break和continue的区别 break跳出循环 continue跳出本次循环继续执行

n2 = 10

while n2 > 0:

if(n2%2 == 0):

print(n2)

n2 -= 1;

break

n3 = 10

while n3 > 0:

if(n3%2 == 0):

print(n3)

n3 -= 1;

continue

1.2 函数import math

#请定义一个函数quadratic(a, b, c),接收3个参数,返回一元二次方程 ax^2+bx+c=0的两个解

def quadratic(a,b,c):

dert = b**2 - 4*a*c

if a == 0:

return -b/c

if dert>=0:

x1 = (-b+math.sqrt(dert))/(2*a)

x2 = (-b-math.sqrt(dert))/(2*a)

return x1,x2

else:

print("无解")

print(quadratic(2,3,1))

# ####注意:默认参数必须指向不可变变量

def add_end(l=None):

if l is None:

l = []

l.append("END")

return l

print(add_end())

print(add_end())

# 可变参数

def calc(numbers):

sum = 0

for n in numbers:

sum = sum + n * n

return sum

num = (12,12,12)

print(calc(num))

1.3 文件读写# 文件的操作

# 一、读文件read

# 以r的模式打开一个文件对象 指定文件编码为UTF-8

f = open('E:/test.txt','r',encoding='UTF-8')

# 打印读文件到内存中并打印文件内容

# read()读取文件全部内容 read(size)每次最多读取size大小的内容反复读取

# readline() 读取一行内容 readlines()一次性读取所有内容并按行返回['大数据学习笔记:\n', '20190629\n']

print(f.read())

print(f.read(1024))

print(f.readline())

print(f.readlines())

# 关闭文件

f.close()

# 二、使用with,可以省去每次都关闭文件的步骤

with open('E:/test.txt','r',encoding='UTF-8') as f:

print(f.read())

# 注意:如果文件不存在会报IOError,可以使用try .. exception ..else ..finally处理

# 如果是二进制文件,则使用rb模式打开文件

# 三、写文件 以w的模式打开文件 如果是二进制文件,使用wb

f = open('E:/test.txt','w',encoding='UTF-8')

f.write('hello world')

f.close()

# 四、使用with

with open('E:/test.txt','w',encoding='UTF-8') as f:

f.write('hello world')

# 五、使用append追加模式写入

f = open('E:/test.txt','a',encoding='UTF-8')

f.write('hello world')

f.close()

Python基本数据结构

字典

字典也叫元组(tuple),但是一旦初始化就不能修改,相当于java中的数组。

列表

列表(list)是一种有序的集合,可以随时添加和删除其中的元素。

代码展示为:# list集合

students = ['lixiaoqi','xuyang','xiaowang','xiaohua']

# 获取list的长度

print(len(students))

# 获取指定索引的元素

print(students[0])

# 获取末尾的索引元素

print(students[-1])

# 追加元素 默认为在list最后追加

students.append("huahua")

print(students)

# 指定位置添加元素

students.insert(1,"honghong")

print(students)

# 指定位置删除元素

students.pop(-1)

print(students)

# 指定位置替换元素

students[0] = "qiqige"

print(students)

# tuple元组 一旦初始化就不能更改 没有append和insert方法

fruit = ("apple","orange","banana","")

print(fruit)

print(fruit[1])

二、Pandas基础

Pandas环境安装

pandas是基于NumPy的一种工具库,该工具库是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。

在pycharm中使用pandas进行数据分析时,首先要引入pandas库,这里以numpy举例

Pandas数据结构:Series和Dataframe

pandas是基于numpy数组之上的,pandas的主要数据结构为Series(系列),DataFrame(数据帧)和Panel(面板)

Series(系列)是具有均匀数据的一维数组结构 特点:均匀数据 尺寸大小不变 数据值可变

DataFrame(数据帧)是一个具有异构数据的二维数组 特点:异构数据 大小可变 数据可变

Panel(面板)是具有异构数据的三维数据结构 特点:异构数据 大小可变 数据可变

代码展示为:import numpy as np

import pandas as pd

# Series对象创建

s1 = pd.Series([1,3,5,np.nan,6,8])

print(s1)

dates = pd.date_range('20190726',periods=7)

print(dates)

# DataFrame对象创建方式一

s2 = pd.DataFrame(np.random.rand(7,4),index=dates,columns=list('ABCD'))

print(s2)

# DataFrame对象创建方式二

df2 = pd.DataFrame({ 'A' : 1.0,

'B' : pd.Timestamp('20170102'),

'C' : pd.Series(1,index=list(range(4)),dtype='float32'),

'D' : np.array([3] * 4,dtype='int32'),

'E' : pd.Categorical(["test","train","test","train"]),

'F' : 'foo' })

print(df2)

对应的输出结果为:

Python数据分析基础 Python数据分析基础

三、实践

对应的数据描述请查看No.01统计学之数据的描述性统计import numpy as np

import pandas as pd

my_array = [12,23,45,56,78,23,45,80]

pd.Series(my_array)

print('众数',s.mode())

print('中位数',s.median())

print('平均数',s.sum()/s.count())

print('第一四分位数',s.quantile(q=0.25, interpolation="linear"))

print('第二四分位数',s.quantile(q=0.5, interpolation="linear"))

print('第三四分位数',s.quantile(q=0.75, interpolation="linear"))

print('算术平均数',s.mean())

print('加权平均数',np.average(my_array,weights=[0.1,0.1,0.1,0.1,0.2,0.2,0.1,0.1]))

print('方差',s.var())

print('标准差',s.std())

print('极差',s.max()-s.min())

print('平均绝对离差',s.mad())

print('四分位率',s.quantile(q=0.75)-s.quantile(q=0.25))

print('偏度',s.skew())

print('峰度',s.kurt())

对应的输出结果为

Python数据分析基础

已修改 0/20

本文标题: Python数据分析基础
本文地址: http://www.aqhwyy.com/keji/2694479.html

如果认为本文对您有所帮助请赞助本站

支付宝扫一扫赞助微信扫一扫赞助

  • 支付宝扫一扫赞助
  • 微信扫一扫赞助
  • 支付宝先领红包再赞助
    声明:凡注明"本站原创"的所有文字图片等资料,版权均属安庆海王新闻网所有,欢迎转载,但务请注明出处。
    被遗忘的App:5亿人都在用,还是上不了市后补贴时代,北汽新能源还能否继续夺冠?
    Top