Analysis
Analsis模块的目标是让用户能够更简便的理解数据,我们提供多种多样的Anayzer去帮助用户洞察数据。并且我们提供了Report API去给用户展示多种Analyzer组合分析的数据
1. Analyzer
目前支持的分析器:
Summary : 总结指标,目前支持均值、方差、最小值、25%中位数、50%中位数、75%中位数、最大值、缺失百分比、平稳性p值。
Max : 计算给定列的最大值。
FFT : 基于快速傅里叶变换的信号频域分析。
STFT : 基于短时傅里叶变换的信号时频分析。
CWT : 基于连续小波变换的信号时频分析。
下面的代码展示了如何用Analyzer分析数据。我们用 UNI_WTH
数据作为样例, UNI_WTH
是一份包含了2010年–2014年的关于天气的单变量数据,其中 WetBulbCelsuis
代表湿球温度。
from paddlets.datasets.repository import get_dataset
from paddlets.analysis import Summary
tsdataset = get_dataset('UNI_WTH')
tsdataset.summary()
sum = Summary()
sum(tsdataset)
# WetBulbCelsius
#missing 0.000000
#count 35064.000000
#mean 1.026081
#std 6.898354
#min -26.400000
#25% -3.800000
#50% 0.600000
#75% 6.600000
#max 16.300000
注意Base Analyzers可以用更简便的方式去调用:
目前支持的base analyzers有: Summary, Max。
from paddlets.datasets.repository import get_dataset
tsdataset = get_dataset('UNI_WTH')
tsdataset.summary()
1. Analysis Report
Report支持多种Analyzer自动组合分析。 下面演示了获取分析报告的三个示例:
2.1 获取默认的分析报告
from paddlets.analysis import AnalysisReport
from paddlets.datasets.repository import get_dataset
tsdataset = get_dataset('UNI_WTH')
report = AnalysisReport(tsdataset)
# export a file named "analysis_report.docx" to current path by default
report.export_docx_report()
2.2 获取自定义Analyzer的分析报告
from paddlets.analysis import AnalysisReport
from paddlets.datasets.repository import get_dataset
tsdataset = get_dataset('UNI_WTH')
report = AnalysisReport(tsdataset, ["summary","fft"])
# export a file named "analysis_report.docx" to current path by default
report.export_docx_report()
2.3 获取自定义Analyzer与配置的分析报告
from paddlets.analysis import AnalysisReport
from paddlets.datasets.repository import get_dataset
tsdataset = get_dataset('UNI_WTH')
customized_config = {"fft":{
"norm":False,
"fs":1
}
}
report = AalysisReport(tsdataset, ["summary","fft"], customized_config)
# export a file named "analysis_report.docx" to current path by default
report.export_docx_report()