admin 管理员组文章数量: 887040
2024年1月14日发(作者:nginx的配置文件目录是)
python pandas dataframe用法
Python 是一门广泛使用的编程语言,数据分析是 Python 的一大应用领域。pandas 是 Python 的一个数据分析库,它提供了丰富的数据结构和数据分析工具,使得数据处理更加高效和简单。
DataFrame 是 pandas 中最重要的数据结构之一,它可以看作是一个二维表格,类似于 Excel 中的一个工作表。一个 DataFrame 可以由任意列类型的数据构成,包括整数、浮点数、字符串等。DataFrame 的一些重要操作包括索引、切片、过滤、排序、聚合、合并等。
下面是一些基本的 DataFrame 操作:
1. 创建一个 DataFrame
可以用一个字典或列表来创建一个 DataFrame。例如,下面的代码创建一个包含 3 个人姓名、年龄、性别信息的 DataFrame。
```python
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [21, 25, 23],
'Gender': ['F', 'M', 'M']}
df = ame(data)
print(df)
```
输出:
```
Name Age Gender
0 Alice 21 F
1 Bob 25 M
2 Charlie 23 M
```
另外,也可以从 CSV 文件或 Excel 文件中读取数据创建 DataFrame。
2. 查看 DataFrame 信息
可以通过以下操作来查看 DataFrame 的维度、列名、数据类型等信息。
```python
print() # 查看 DataFrame 的维度
print(s) # 查看 DataFrame 的列名
print() # 查看 DataFrame 的数据类型
```
输出:
```
(3, 3)
Index(['Name', 'Age', 'Gender'], dtype='object')
Name object
Age int64
Gender object
dtype: object
```
3. 索引和切片
可以使用列名或行名对 DataFrame 进行索引和切片。例如,下面的代码选取了第一个人的姓名和年龄。
```python
print([0, ['Name', 'Age']])
```
输出:
```
Name Alice
Age 21
Name: 0, dtype: object
```
另外也可以使用位置来进行索引和切片。
```python
print([0, [0, 1]]) # 索引第一行的第一列和第二列
print([0:2, :]) # 切片取前两行
```
4. 过滤
可以使用条件表达式对 DataFrame 进行过滤。例如,下面的代码选取了所有年龄大于 22 岁的人。
```python
print(df[df['Age'] > 22])
```
输出:
```
Name Age Gender
1 Bob 25 M
2 Charlie 23 M
```
5. 排序
可以按照指定的列进行升序或降序排列。例如,下面的代码按照年龄降序排列。
```python
print(_values(by=['Age'], ascending=False))
```
输出:
```
Name Age Gender
1 Bob 25 M
2 Charlie 23 M
0 Alice 21 F
```
6. 聚合
可以对 DataFrame 进行聚合操作,比如求和、求平均值等。例如,下面的代码计算了所有人的平均年龄。
```python
print(df['Age'].mean())
```
输出:
```
23.0
```
7. 合并
可以使用 concat、merge 或 join 等函数将多个 DataFrame 进行合并。例如,下面的代码将两个含有相同列名的 DataFrame 按行合并。
```python
data2 = {'Name': ['David'], 'Age': [27], 'Gender': ['M']}
df2 = ame(data2)
df_concat = ([df, df2], ignore_index=True)
print(df_concat)
```
输出:
```
Name Age Gender
0 Alice 21 F
1 Bob 25 M
2 Charlie 23 M
3 David 27 M
```
以上是一些基本的 pandas DataFrame 操作,还有很多高级操作比如分组、透视表等,不再一一列举。不过,掌握了 DataFrame 的基本操作,再学习这些高级操作就会更加容易了。
版权声明:本文标题:python pandas dataframe用法 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1705229448h477785.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论