Python数据分析之读取Excel文件的实践案例

tamoadmin 赛事报道 2024-04-23 27 0

数据分析领域,Python提供了多个强大的库来进行数据处理,其中Pandas库是非常重要的一款工具。Pandas库能够方便地进行数据的读取、处理、分析和可视化。在读取Excel文件时,我们可以使用Pandas库的`read_excel`函数来实现。

下面是一些实践案例:

案例1:基本读取

```python

import

pandas

as

pd

读取Excel文件

df

=

pd.read_excel('data.xlsx')

输出前5行数据

print(df.head())

```

案例2:指定工作表读取

```python

读取特定工作表

df

=

pd.read_excel('data.xlsx',

sheet_name='Sheet1')

或者指定多个工作表读取

dfs

=

pd.read_excel('data.xlsx',

sheet_name=['Sheet1',

'Sheet2'])

输出每个工作表的内容

for

sheet,

df_sheet

in

dfs.items():

print(f'

{sheet}

')

print(df_sheet)

```

案例3:选择性读取

```python

只读取某些列

df

=

pd.read_excel('data.xlsx',

usecols='A:C')

或者指定具体的列名

df

=

pd.read_excel('data.xlsx',

usecols=['A',

'C',

Python数据分析之读取Excel文件的实践案例

'E'])

输出前5行数据

print(df.head())

```

案例4:读取多个Excel文件

```python

遍历文件夹内所有Excel文件并读取

import

os

folder_path

=

'excelfiles'

all_data

=

[]

for

filename

in

os.listdir(folder_path):

if

filename.endswith('.xlsx'):

file_path

=

os.path.join(folder_path,

filename)

df

=

pd.read_excel(file_path)

all_data.append(df)

将所有数据合并

total_df

=

pd.concat(all_data,

ignore_index=True)

输出总数据

print(total_df)

```

以上案例展示了如何使用Pandas库来读取Excel文件,包括基本读取、选择性读取、指定工作表读取以及批量读取多个文件。在实际工作中,可以根据具体需求灵活应用这些方法来处理数据。