tdhook.attribution.saliency#

Classes#

Saliency

Gradient attribution [8] and its gradient-times-input variation [9].

Module Contents#

class tdhook.attribution.saliency.Saliency(use_inputs=True, use_outputs=True, input_modules=None, target_modules=None, init_attr_targets=None, init_attr_inputs=None, init_attr_cache_in=None, init_attr_grads=None, additional_init_keys=None, output_grad_callbacks=None, attribution_key='attr', clean_intermediate_keys=True, cache_callback=None, absolute=False, multiply_by_inputs=False)[source]#

Bases: tdhook.attribution.gradient_helpers.GradientAttribution

Gradient attribution [8] and its gradient-times-input variation [9].

Parameters:

use_inputs (bool)
use_outputs (bool)
input_modules (Optional[List[str]])
target_modules (Optional[List[str]])
init_attr_targets (Optional[Callable[[tensordict.TensorDict, tensordict.TensorDict], tensordict.TensorDict]])
init_attr_inputs (Optional[Callable[[tensordict.TensorDict, tensordict.TensorDict], tensordict.TensorDict]])
init_attr_cache_in (Optional[Callable[[tensordict.TensorDict, tensordict.TensorDict], tensordict.TensorDict]])
init_attr_grads (Optional[Callable[[tensordict.TensorDict, tensordict.TensorDict], tensordict.TensorDict]])
additional_init_keys (Optional[List[tdhook._types.UnraveledKey]])
output_grad_callbacks (Optional[Dict[str, Callable]])
attribution_key (tdhook._types.UnraveledKey)
clean_intermediate_keys (bool)
cache_callback (Optional[Callable])
absolute (bool)
multiply_by_inputs (bool)

_absolute = False[source]#

_multiply_by_inputs = False[source]#

_grad_attr(grads, inputs)[source]#

Parameters:

grads (tensordict.TensorDict)
inputs (tensordict.TensorDict)