paddlets.utils.validation

cross_validate(data: ~paddlets.datasets.tsdataset.TSDataset, estimator: ~paddlets.models.base.Trainable, splitter: ~paddlets.datasets.splitter.SplitterBase = <paddlets.datasets.splitter.ExpandingWindowSplitter object>, use_backtest: bool = True, predict_window: ~typing.Optional[int] = None, stride: ~typing.Optional[int] = None, metric: ~typing.Optional[~paddlets.metrics.base.Metric] = None, return_score=True, reduction: ~typing.Optional[~typing.Callable[[~numpy.ndarray], float]] = <function mean>, verbose: bool = False) Union[float, List[dict]][源代码]

时间序列的交叉验证

参数
  • data (TSDataset) – 待验证的数据

  • estimator (Trainable) – 交叉验证所用的模型

  • splitter (SplitterBase) – CV splitter,默认使用5折扩大窗口交叉验证

  • use_backtest (bool) – 是否使用回测,默认使用回测,如果不使用回测的话默认使用滚动预测

  • predict_window (int) – 预测窗口的长度,只有开启回测时需要

  • stride (int) – 两个连续预测之间的步长,只有开启回测时需要

  • metric (Metric) – 指标计算方法,默认为MAE()

  • return_score (bool) – 如果为True返回score值,如果为false返回一个dict(包括score,预测值,模型等)。

  • reduction (Callable[[np.ndarray]|None) – 指标计算公式,默认为 np.mean

  • verbose (bool) – 是否开启日志打印,默认开启

返回

float, list[dict]

引发

ValueError

fit_and_score(train_data: ~typing.Union[~paddlets.datasets.tsdataset.TSDataset, ~typing.List[~paddlets.datasets.tsdataset.TSDataset]], valid_data: ~typing.Union[~paddlets.datasets.tsdataset.TSDataset, ~typing.List[~paddlets.datasets.tsdataset.TSDataset]], estimator: ~paddlets.models.base.Trainable, use_backtest: bool = True, predict_window: ~typing.Optional[int] = None, stride: ~typing.Optional[int] = None, metric: ~typing.Optional[~paddlets.metrics.base.Metric] = None, return_score=True, return_estimator=True, return_predicts=True, reduction: ~typing.Optional[~typing.Callable[[~numpy.ndarray], float]] = <function mean>, verbose: bool = False) dict[源代码]

训练并计算score

参数
  • train_data (Union[TSDataset, List[TSDataset]]) – 训练集

  • valid_data (Union[TSDataset, List[TSDataset]]) – 训练集

  • estimator (Trainable) – 交叉验证所用的模型

  • use_backtest (bool) – 是否使用回测,默认使用回测,如果不使用回测的话默认使用滚动预测

  • predict_window (int) – 预测窗口的长度,只有开启回测时需要

  • stride (int) – 两个连续预测之间的步长,只有开启回测时需要

  • metric (Metric) – 指标计算方法,默认为MAE()

  • verbose (bool) – 是否开启日志打印,默认开启

  • return_score (bool) – 结果是否返回score

  • return_estimator (bool) – 是否返回模型

  • reduction (Callable[[np.ndarray]|None) – 指标计算公式,默认为 np.mean

返回

dict

引发

ValueError