pandas

时间:2024-01-25 19:33:41

 

# 导入基础数据分析模块包

import numpy as np
import pandas as pd
from pandas import Series, DataFrame
import matplotlib.pyplot as plt

# 忽略警告

import warnings
warnings.filterwarnings('ignore')

 

# 显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)

 

# 字符串列转日期列

df["datetime_col"] = pd.to_datetime(df["datetime_col"], format='%Y/%m/%d')

# 查看样本的数和特征列数
print(df.shape)
# 查看数据基本行列大小、类型、内存信息
df.info()

 

# 生成数据报表并保存
import pandas_profiling

profile = pandas_profiling.ProfileReport(df)
profile

# 保存数据报表

profile.to_file(outputfile =  "output_file.html")