Pandas的入门操作-DataFrame对象

news/2024/9/19 15:33:17 标签: pandas

目录

类型

通过 pd.read_csv('xxx')返回df

将Series对象通过to_frame()转成df

使用列表 加元组返回df

使用字典返回df

DataFrame对象的常用属性和方法

常用属性

常用方法

实例

DataFrame对象的运算

加载数据

字符串的运算

字符串和数字(会报错)

根据下表获取数据


类型

通过 pd.read_csv('xxx')返回df

# 通过 pd.read_csv('xxx') 返回 df
import pandas as pd

df = pd.read_csv('../data/a_scientists.csv')
print(df)
print('-----------------------------')
print(type(df))

将Series对象通过to_frame()转成df

# 将 Series对象 通过 to_frame() 转成 df
s2 = pd.Series(['张三', '李四', '王五'])
print(type(s2))
print('-------------------')
print(type(s2.to_frame()))

使用列表 加元组返回df

# 使用 列表 加 元组 返回 df
studentList = [
    (1, '张三', 18),
    (2, '李四', 14),
    (3, '王五', 19)
]

df3 = pd.DataFrame(studentList, columns=['编号', '姓名', '年龄'], index=['A', 'B', 'C'])
print(df3)
print('----------------')
print(type(df3))

使用字典返回df

# 使用 字典 返回 df
dict1 = {
    "id" : [1, 2, 3],
    "name" : ['张三', '李四', '王五'],
    "city" : ['洛阳', '信阳', '安阳']
}

df4 = pd.DataFrame(dict1)
print(df4)
print('----------------')
print(type(df4))

DataFrame对象的常用属性和方法

加载数据

import pandas as pd

df = pd.read_csv('../data/a_scientists.csv')
df

常用属性

# print('=============== 常用属性 ===============')
# 查看维度, 返回元组类型 -> (行数, 列数), 元素个数代表维度数
# print(df.shape)

# 查看数据值个数, 行数*列数, NaN值也算
# print(df.size)

# 查看数据值, 返回numpy的ndarray类型
print(df.values)
# print('---------------------------')
print(type(df.values))

# 查看维度数
print(df.ndim)

# 返回列名和列数据类型
print(df.dtypes)

# 查看索引值, 返回索引值对象
print(df.index)

# 查看列名, 返回列名对象
print(df.columns)

常用方法

print('=============== 常用方法 ===============')
# # 查看前5行数据
print(df.head())
# # 查看后5行数据
print(df.tail())
print(df.tail(3))
# 
# 查看df的基本信息
print(df.info())
# 
# 查看df对象中所有数值列的描述统计信息
print(df.describe())
# 
# 查看df对象中所有非数值列的描述统计信息
# exclude:不包含指定类型列
print(df.describe(exclude=['int', 'float']))
# 
# 查看df对象中所有列的描述统计信息
# include:包含指定类型列, all代表所有类型
print(df.describe(include='all'))
# 
# 查看df的行数
print(len(df))
# 
# 查看df各列的最小值
print(df.min())
# 
# # 查看df各列的非空值个数
print(df.count())
# 
# # 查看df数值列的平均值
print(df.mean())

实例

import pandas as pd

# 加载数据 ./data/a_scientists.csv
df = pd.read_csv('../data/a_scientists.csv')
df

 求平均年龄

# 求 平均年龄
df['Age'].mean()  # 59.125

求 是否高于平均年龄

# 求 是否高于平均年龄
df['Age'] > df['Age'].mean()

# 求高于平均年龄的数据
df[df['Age'] > df['Age'].mean()]

# 求高于平均年龄的数据(列表)
print(type(df['Age'] > df['Age'].mean()))

print(type(list(df['Age'] > df['Age'].mean())))

print(df[list(df['Age'] > df['Age'].mean())])

DataFrame对象的运算

加载数据

import pandas as pd

# 加载数据 df
df = pd.read_csv('../data/a_scientists.csv')
df

字符串的运算

# 观察 df + df
df + df

字符串和数字(会报错)

# 观察 df + 2 # 报错
df + 2

根据下表获取数据

print(df[df.index.isin([0, 2, 4])])
print('-----------------------------------------')
print(df.loc[[0, 2, 4]])


http://www.niftyadmin.cn/n/5665787.html

相关文章

【工具】Java Excel转图片

【工具】Java Excel转图片 package com.yj.luban.modules.office.excel;import org.apache.poi.ss.usermodel.*; import org.apache.poi.xssf.usermodel.XSSFWorkbook;import javax.imageio.ImageIO; import java.awt.Color; import java.awt.Font; import java.awt.*; import …

ant vue3 datePicker默认显示英文

改前: 改后: 处理方法: 在App.vue页加上以下导入即可 import dayjs from dayjs; import dayjs/locale/zh-cn dayjs.locale(zh-cn); 如图:

python植物大战僵尸项目源码【免费】

植物大战僵尸是一款经典的塔防游戏,玩家通过种植各种植物来抵御僵尸的进攻。 源码下载地址: 植物大战僵尸项目源码 提取码: 8muq

胤娲科技:解锁AI奥秘——产品经理的智能进化之旅

当AI不再是遥不可及的科幻 想象一下,你走进一家未来感十足的咖啡厅,无需言语,智能咖啡机就能根据你的偏好调制出一杯完美的拿铁; 打开手机,AI助手不仅提醒你今天有雨,还贴心推荐了最适合雨中漫步的音乐列表…

【linux】pwd命令

pwd 命令在 Linux 和类 Unix 系统中用于显示当前工作目录的完整路径。它是 "print working directory" 的缩写。 当你在终端或命令行界面中工作时,你可能会在不同的目录(或文件夹)之间切换。pwd 命令帮助你确定你当前位于哪个目录…

基于JavaWeb开发的java+Springboot操作系统教学交流平台详细设计实现

基于JavaWeb开发的javaSpringboot操作系统教学交流平台详细设计实现 🍅 作者主页 网顺技术团队 🍅 欢迎点赞 👍 收藏 ⭐留言 📝 🍅 文末获取源码联系方式 📝 🍅 查看下方微信号获取联系方式 承接…

浅谈openresty

熟悉了nginx后再来看openresty,不得不说openresty是比较优秀的。 对nginx和openresty的历史等在这此就不介绍了。 首先对标nginx,自然有优劣 一、开发难度 nginx: 毫无疑问nginx的开发难度比较高,需要扎实的c/c基础&#xff…

Git项目管理工具

分布式版本控制系统 实际操作: 设置用户信息 git config --global user.name “itcast” git config --global user.email "hello@itcast.cn" </