paddlets.models.anomaly.dl.anomaly_transformer
基于Anomaly Transformer论文复现模型,论文地址:”<https://arxiv.org/pdf/2110.02642.pdf>`_ .
- 模型基本特征。
模型基本结构: 一个堆积异常注意力机制的网络模型。
Anomaly Attention的两个分支:一个是自注意力机制,另一个是高斯核函数。
反向传播过程中: 同时计算局部关联损失差异和全局关联损失差异,这是用来区分正常数据和异常数据的方法。
- class AnomalyTransformer(in_chunk_len: int, sampling_stride: int = 1, loss_fn: ~typing.Callable[[...], ~paddle.Tensor] = <function series_prior_loss>, optimizer_fn: ~typing.Callable[[...], ~paddle.optimizer.optimizer.Optimizer] = <class 'paddle.optimizer.adam.Adam'>, threshold_fn: ~typing.Callable[[...], float] = <function anomaly_get_threshold>, criterion: ~typing.Callable[[...], ~paddle.Tensor] = MSELoss(), threshold: ~typing.Optional[float] = None, threshold_coeff: float = 1.0, anomaly_score_fn: ~typing.Optional[~typing.Callable[[...], ~typing.List[float]]] = None, pred_adjust: bool = True, pred_adjust_fn: ~typing.Callable[[...], ~numpy.ndarray] = <function result_adjust>, optimizer_params: ~typing.Dict[str, ~typing.Any] = {'learning_rate': 0.0001}, eval_metrics: ~typing.List[str] = [], callbacks: ~typing.List[~paddlets.models.common.callbacks.callbacks.Callback] = [], batch_size: int = 32, max_epochs: int = 100, verbose: int = 1, patience: int = 10, seed: ~typing.Union[None, int] = None, temperature: int = 50, k: int = 3, anormly_ratio=1, d_model: int = 512, n_heads: int = 8, e_layers: int = 3, d_ff: int = 512, dropout: float = 0.0, activation: ~typing.Callable[[...], ~paddle.Tensor] = <function gelu>, output_attention=True)[源代码]
-
Anomaly Transformer神经网络用于计算异常检测。
- 参数
in_chunk_len (int) – 模型输入的时间序列长度。
sampling_stride (int) – 每两个相邻样本之间的采集间隔。
loss_fn (Callable[..., paddle.Tensor]) – 损失函数。
optimizer_fn (Callable[..., Optimizer]) – 优化方法。
threshold_fn (Callable[..., float]|None) – 计算阈值的方法。
criterion (Callable[..., paddle.Tensor]) – 计算重建损失的损失函数。
threshold (float|None) – 用于判别异常的阈值。
threshold_coeff (float) – 阈值的系数。
anomaly_score_fn (Callable[..., List[float]]|None) – 用于计算异常得分的方法。
pred_adjust (bool) – 是否根据实际标签调整预测结果。
pred_adjust_fn (Callable[..., np.ndarray]|None) – 调整预测结果的方法。
optimizer_params (Dict[str, Any]) – 优化器参数。
eval_metrics (List[str]) – 模型评估指标。
callbacks (List[Callback]) – 自定义回调函数。
batch_size (int) – 每个训练批次的样本数量。
max_epochs (int) – 训练过程的最大迭代次数。
verbose (int) – 详细模式。
patience (int) – 设置多少轮迭代没有提升后,则提前结束训练。
seed (int|None) – 全局随机数种子, 注: 保证每次模型参数初始化一致。
temperature (int|float) – 一个用于调整全局关联损失和局部关联损失的参数。
k (int) – 优化策略:放大关联差异。
anormly_ratio (int|float) – 训练集和测试集比例。
d_model (int) – anomaly transformer模型的输入维度大小。
n_heads (int) – 模型多头的数量。
e_layers (int) – 注意力层的堆积数量。
d_ff (int) – 前馈神经网络的通道数量。
dropout (float) – Dropout参数。
activation (Callable[..., paddle.Tensor]) – AnomalyAttention中的注意力函数。
output_attention (float) – 是否要输出全局向量,相邻向量,高斯核参数向量。
- _in_chunk_len
模型输入的时间序列长度。
- Type
int
- _sampling_stride
每两个相邻样本之间的采集间隔。
- Type
int
- _loss_fn
损失函数。
- Type
Callable[…, paddle.Tensor]
- _optimizer_fn
优化方法。
- Type
Callable[…, Optimizer]
- _threshold_fn
计算阈值的方法。
- Type
Callable[…, float]|None
- _criterion
计算重建损失的损失函数。
- Type
Callable[…, paddle.Tensor]
- _threshold
用于判别异常的阈值。
- Type
float|None
- _threshold_coeff
阈值的系数。
- Type
float
- _anomaly_score_fn
用于计算异常得分的方法。
- Type
Callable[…, List[float]]|None
- _pred_adjust
是否根据实际标签调整预测结果。
- Type
bool
- _pred_adjust_fn
调整预测结果的方法。
- Type
Callable[…, np.ndarray]|None
- _optimizer_params
优化器参数。
- Type
Dict[str, Any]
- _eval_metrics
模型评估指标。
- Type
List[str]
- _batch_size
每个训练批次的样本数量。
- Type
int
- _max_epochs
训练过程的最大迭代次数。
- Type
int
- _verbose
详细模式。
- Type
int
- _patience
设置多少轮迭代没有提升后,则提前结束训练。
- Type
int
- _seed
全局随机数种子, 注: 保证每次模型参数初始化一致。
- Type
int|None
- _temperature
一个用于调整全局关联损失和局部关联损失的参数。
- Type
int|float
- _k
优化策略:放大关联差异。
- Type
int
- _anormly_ratio
训练集和测试集比例。
- Type
int|float
- _d_model
anomaly transformer模型的输入维度大小。
- Type
int
- _n_heads
模型多头的数量。
- Type
int
- _e_layers
注意力层的堆积数量。
- Type
int
- _d_ff
前馈神经网络的通道数量。
- Type
int
- _dropout
Dropout参数。
- Type
float
- _activation
AnomalyAttention中的注意力函数。
- Type
Callable[…, paddle.Tensor]
- _output_attention
是否要输出全局向量,相邻向量,高斯核参数向量。
- Type
float
- _adjust_lr
动态调整学习率。
- Type
功能。
- predict(test_dataset: TSDataset, train_dataset: TSDataset = None) TSDataset[源代码]
得出每个批次的异常label,输出为tsdataset数据类型。