Analysis

Analsis模块的目标是让用户能够更简便的理解数据,我们提供多种多样的Anayzer去帮助用户洞察数据。并且我们提供了Report API去给用户展示多种Analyzer组合分析的数据

1. Analyzer

目前支持的分析器:

  • Summary : 总结指标,目前支持均值、方差、最小值、25%中位数、50%中位数、75%中位数、最大值、缺失百分比、平稳性p值。

  • Max : 计算给定列的最大值。

  • FFT : 基于快速傅里叶变换的信号频域分析。

  • STFT : 基于短时傅里叶变换的信号时频分析。

  • CWT : 基于连续小波变换的信号时频分析。

下面的代码展示了如何用Analyzer分析数据。我们用 UNI_WTH 数据作为样例, UNI_WTH 是一份包含了2010年–2014年的关于天气的单变量数据,其中 WetBulbCelsuis 代表湿球温度。

from paddlets.datasets.repository import get_dataset
from paddlets.analysis import Summary
tsdataset = get_dataset('UNI_WTH')
tsdataset.summary()
sum = Summary()
sum(tsdataset)

#         WetBulbCelsius
#missing        0.000000
#count      35064.000000
#mean           1.026081
#std            6.898354
#min          -26.400000
#25%           -3.800000
#50%            0.600000
#75%            6.600000
#max           16.300000

注意Base Analyzers可以用更简便的方式去调用:

目前支持的base analyzers有: Summary, Max。

from paddlets.datasets.repository import get_dataset
tsdataset = get_dataset('UNI_WTH')
tsdataset.summary()

1. Analysis Report

Report支持多种Analyzer自动组合分析。 下面演示了获取分析报告的三个示例:

2.1 获取默认的分析报告

from paddlets.analysis import AnalysisReport
from paddlets.datasets.repository import get_dataset
tsdataset = get_dataset('UNI_WTH')
report = AnalysisReport(tsdataset)
# export a file named "analysis_report.docx" to current path by default
report.export_docx_report()

2.2 获取自定义Analyzer的分析报告

from paddlets.analysis import AnalysisReport
from paddlets.datasets.repository import get_dataset
tsdataset = get_dataset('UNI_WTH')
report = AnalysisReport(tsdataset, ["summary","fft"])
# export a file named "analysis_report.docx" to current path by default
report.export_docx_report()

2.3 获取自定义Analyzer与配置的分析报告

from paddlets.analysis import AnalysisReport
from paddlets.datasets.repository import get_dataset
tsdataset = get_dataset('UNI_WTH')
customized_config = {"fft":{
                 "norm":False,
                 "fs":1
                  }
         }
report = AalysisReport(tsdataset, ["summary","fft"], customized_config)
# export a file named "analysis_report.docx" to current path by default
report.export_docx_report()