doxygen/4.1/af__dynaudnorm_8c_source.html

 /*

  * Dynamic Audio Normalizer

  * Copyright (c) 2015 LoRd_MuldeR <mulder2@gmx.de>. Some rights reserved.

  *

  * This file is part of FFmpeg.

  *

  * FFmpeg is free software; you can redistribute it and/or

  * modify it under the terms of the GNU Lesser General Public

  * License as published by the Free Software Foundation; either

  * version 2.1 of the License, or (at your option) any later version.

  *

  * FFmpeg is distributed in the hope that it will be useful,

  * but WITHOUT ANY WARRANTY; without even the implied warranty of

  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU

  * Lesser General Public License for more details.

  *

  * You should have received a copy of the GNU Lesser General Public

  * License along with FFmpeg; if not, write to the Free Software

  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA

  */


 /**

  * @file

  * Dynamic Audio Normalizer

  */


 #include <float.h>


 #include "libavutil/avassert.h"

 #include "libavutil/opt.h"


 #define FF_BUFQUEUE_SIZE 302

 #include "libavfilter/bufferqueue.h"


 #include "audio.h"

 #include "avfilter.h"

 #include "internal.h"


 typedef struct cqueue {

     double *elements;

     int size;

     int nb_elements;

     int first;

 } cqueue;


 typedef struct DynamicAudioNormalizerContext {

     const AVClass *class;


     struct FFBufQueue queue;


     int frame_len;

     int frame_len_msec;

     int filter_size;

     int dc_correction;

     int channels_coupled;

     int alt_boundary_mode;


     double peak_value;

     double max_amplification;

     double target_rms;

     double compress_factor;

     double *prev_amplification_factor;

     double *dc_correction_value;

     double *compress_threshold;

     double *fade_factors[2];

     double *weights;


     int channels;

     int delay;


     cqueue **gain_history_original;

     cqueue **gain_history_minimum;

     cqueue **gain_history_smoothed;

 } DynamicAudioNormalizerContext;


 #define OFFSET(x) offsetof(DynamicAudioNormalizerContext, x)

 #define FLAGS AV_OPT_FLAG_AUDIO_PARAM|AV_OPT_FLAG_FILTERING_PARAM


 static const AVOption dynaudnorm_options[] = {

     { "f", "set the frame length in msec",     OFFSET(frame_len_msec),    AV_OPT_TYPE_INT,    {.i64 = 500},   10,  8000, FLAGS },

     { "g", "set the filter size",              OFFSET(filter_size),       AV_OPT_TYPE_INT,    {.i64 = 31},     3,   301, FLAGS },

     { "p", "set the peak value",               OFFSET(peak_value),        AV_OPT_TYPE_DOUBLE, {.dbl = 0.95}, 0.0,   1.0, FLAGS },

     { "m", "set the max amplification",        OFFSET(max_amplification), AV_OPT_TYPE_DOUBLE, {.dbl = 10.0}, 1.0, 100.0, FLAGS },

     { "r", "set the target RMS",               OFFSET(target_rms),        AV_OPT_TYPE_DOUBLE, {.dbl = 0.0},  0.0,   1.0, FLAGS },

     { "n", "set channel coupling",             OFFSET(channels_coupled),  AV_OPT_TYPE_BOOL,   {.i64 = 1},      0,     1, FLAGS },

     { "c", "set DC correction",                OFFSET(dc_correction),     AV_OPT_TYPE_BOOL,   {.i64 = 0},      0,     1, FLAGS },

     { "b", "set alternative boundary mode",    OFFSET(alt_boundary_mode), AV_OPT_TYPE_BOOL,   {.i64 = 0},      0,     1, FLAGS },

     { "s", "set the compress factor",          OFFSET(compress_factor),   AV_OPT_TYPE_DOUBLE, {.dbl = 0.0},  0.0,  30.0, FLAGS },

     { NULL }

 };


 AVFILTER_DEFINE_CLASS(dynaudnorm);


 static av_cold int init(AVFilterContext *ctx)

 {

     DynamicAudioNormalizerContext *s = ctx->priv;


     if (!(s->filter_size & 1)) {

         av_log(ctx, AV_LOG_ERROR, "filter size %d is invalid. Must be an odd value.\n", s->filter_size);

         return AVERROR(EINVAL);

     }


     return 0;

 }


 static int query_formats(AVFilterContext *ctx)

 {

     AVFilterFormats *formats;

     AVFilterChannelLayouts *layouts;

     static const enum AVSampleFormat sample_fmts[] = {

         AV_SAMPLE_FMT_DBLP,

         AV_SAMPLE_FMT_NONE

     };

     int ret;


     layouts = ff_all_channel_counts();

     if (!layouts)

         return AVERROR(ENOMEM);

     ret = ff_set_common_channel_layouts(ctx, layouts);

     if (ret < 0)

         return ret;


     formats = ff_make_format_list(sample_fmts);

     if (!formats)

         return AVERROR(ENOMEM);

     ret = ff_set_common_formats(ctx, formats);

     if (ret < 0)

         return ret;


     formats = ff_all_samplerates();

     if (!formats)

         return AVERROR(ENOMEM);

     return ff_set_common_samplerates(ctx, formats);

 }


 static inline int frame_size(int sample_rate, int frame_len_msec)

 {

     const int frame_size = lrint((double)sample_rate * (frame_len_msec / 1000.0));

     return frame_size + (frame_size % 2);

 }


 static void precalculate_fade_factors(double *fade_factors[2], int frame_len)

 {

     const double step_size = 1.0 / frame_len;

     int pos;


     for (pos = 0; pos < frame_len; pos++) {

         fade_factors[0][pos] = 1.0 - (step_size * (pos + 1.0));

         fade_factors[1][pos] = 1.0 - fade_factors[0][pos];

     }

 }


 static cqueue *cqueue_create(int size)

 {

     cqueue *q;


     q = av_malloc(sizeof(cqueue));

     if (!q)

         return NULL;


     q->size = size;

     q->nb_elements = 0;

     q->first = 0;


     q->elements = av_malloc_array(size, sizeof(double));

     if (!q->elements) {

         av_free(q);

         return NULL;

     }


     return q;

 }


 static void cqueue_free(cqueue *q)

 {

     if (q)

         av_free(q->elements);

     av_free(q);

 }


 static int cqueue_size(cqueue *q)

 {

     return q->nb_elements;

 }


 static int cqueue_empty(cqueue *q)

 {

     return !q->nb_elements;

 }


 static int cqueue_enqueue(cqueue *q, double element)

 {

     int i;


     av_assert2(q->nb_elements != q->size);


     i = (q->first + q->nb_elements) % q->size;

     q->elements[i] = element;

     q->nb_elements++;


     return 0;

 }


 static double cqueue_peek(cqueue *q, int index)

 {

     av_assert2(index < q->nb_elements);

     return q->elements[(q->first + index) % q->size];

 }


 static int cqueue_dequeue(cqueue *q, double *element)

 {

     av_assert2(!cqueue_empty(q));


     *element = q->elements[q->first];

     q->first = (q->first + 1) % q->size;

     q->nb_elements--;


     return 0;

 }


 static int cqueue_pop(cqueue *q)

 {

     av_assert2(!cqueue_empty(q));


     q->first = (q->first + 1) % q->size;

     q->nb_elements--;


     return 0;

 }


 static void init_gaussian_filter(DynamicAudioNormalizerContext *s)

 {

     double total_weight = 0.0;

     const double sigma = (((s->filter_size / 2.0) - 1.0) / 3.0) + (1.0 / 3.0);

     double adjust;

     int i;


     // Pre-compute constants

     const int offset = s->filter_size / 2;

     const double c1 = 1.0 / (sigma * sqrt(2.0 * M_PI));

     const double c2 = 2.0 * sigma * sigma;


     // Compute weights

     for (i = 0; i < s->filter_size; i++) {

         const int x = i - offset;


         s->weights[i] = c1 * exp(-x * x / c2);

         total_weight += s->weights[i];

     }


     // Adjust weights

     adjust = 1.0 / total_weight;

     for (i = 0; i < s->filter_size; i++) {

         s->weights[i] *= adjust;

     }

 }


 static av_cold void uninit(AVFilterContext *ctx)

 {

     DynamicAudioNormalizerContext *s = ctx->priv;

     int c;


     av_freep(&s->prev_amplification_factor);

     av_freep(&s->dc_correction_value);

     av_freep(&s->compress_threshold);

     av_freep(&s->fade_factors[0]);

     av_freep(&s->fade_factors[1]);


     for (c = 0; c < s->channels; c++) {

         if (s->gain_history_original)

             cqueue_free(s->gain_history_original[c]);

         if (s->gain_history_minimum)

             cqueue_free(s->gain_history_minimum[c]);

         if (s->gain_history_smoothed)

             cqueue_free(s->gain_history_smoothed[c]);

     }


     av_freep(&s->gain_history_original);

     av_freep(&s->gain_history_minimum);

     av_freep(&s->gain_history_smoothed);


     av_freep(&s->weights);


     ff_bufqueue_discard_all(&s->queue);

 }


 static int config_input(AVFilterLink *inlink)

 {

     AVFilterContext *ctx = inlink->dst;

     DynamicAudioNormalizerContext *s = ctx->priv;

     int c;


     uninit(ctx);


     s->frame_len =

     inlink->min_samples =

     inlink->max_samples =

     inlink->partial_buf_size = frame_size(inlink->sample_rate, s->frame_len_msec);

     av_log(ctx, AV_LOG_DEBUG, "frame len %d\n", s->frame_len);


     s->fade_factors[0] = av_malloc_array(s->frame_len, sizeof(*s->fade_factors[0]));

     s->fade_factors[1] = av_malloc_array(s->frame_len, sizeof(*s->fade_factors[1]));


     s->prev_amplification_factor = av_malloc_array(inlink->channels, sizeof(*s->prev_amplification_factor));

     s->dc_correction_value = av_calloc(inlink->channels, sizeof(*s->dc_correction_value));

     s->compress_threshold = av_calloc(inlink->channels, sizeof(*s->compress_threshold));

     s->gain_history_original = av_calloc(inlink->channels, sizeof(*s->gain_history_original));

     s->gain_history_minimum = av_calloc(inlink->channels, sizeof(*s->gain_history_minimum));

     s->gain_history_smoothed = av_calloc(inlink->channels, sizeof(*s->gain_history_smoothed));

     s->weights = av_malloc_array(s->filter_size, sizeof(*s->weights));

     if (!s->prev_amplification_factor || !s->dc_correction_value ||

         !s->compress_threshold || !s->fade_factors[0] || !s->fade_factors[1] ||

         !s->gain_history_original || !s->gain_history_minimum ||

         !s->gain_history_smoothed || !s->weights)

         return AVERROR(ENOMEM);


     for (c = 0; c < inlink->channels; c++) {

         s->prev_amplification_factor[c] = 1.0;


         s->gain_history_original[c] = cqueue_create(s->filter_size);

         s->gain_history_minimum[c]  = cqueue_create(s->filter_size);

         s->gain_history_smoothed[c] = cqueue_create(s->filter_size);


         if (!s->gain_history_original[c] || !s->gain_history_minimum[c] ||

             !s->gain_history_smoothed[c])

             return AVERROR(ENOMEM);

     }


     precalculate_fade_factors(s->fade_factors, s->frame_len);

     init_gaussian_filter(s);


     s->channels = inlink->channels;

     s->delay = s->filter_size;


     return 0;

 }


 static inline double fade(double prev, double next, int pos,

                           double *fade_factors[2])

 {

     return fade_factors[0][pos] * prev + fade_factors[1][pos] * next;

 }


 static inline double pow_2(const double value)

 {

     return value * value;

 }


 static inline double bound(const double threshold, const double val)

 {

     const double CONST = 0.8862269254527580136490837416705725913987747280611935; //sqrt(PI) / 2.0

     return erf(CONST * (val / threshold)) * threshold;

 }


 static double find_peak_magnitude(AVFrame *frame, int channel)

 {

     double max = DBL_EPSILON;

     int c, i;


     if (channel == -1) {

         for (c = 0; c < frame->channels; c++) {

             double *data_ptr = (double *)frame->extended_data[c];


             for (i = 0; i < frame->nb_samples; i++)

                 max = FFMAX(max, fabs(data_ptr[i]));

         }

     } else {

         double *data_ptr = (double *)frame->extended_data[channel];


         for (i = 0; i < frame->nb_samples; i++)

             max = FFMAX(max, fabs(data_ptr[i]));

     }


     return max;

 }


 static double compute_frame_rms(AVFrame *frame, int channel)

 {

     double rms_value = 0.0;

     int c, i;


     if (channel == -1) {

         for (c = 0; c < frame->channels; c++) {

             const double *data_ptr = (double *)frame->extended_data[c];


             for (i = 0; i < frame->nb_samples; i++) {

                 rms_value += pow_2(data_ptr[i]);

             }

         }


         rms_value /= frame->nb_samples * frame->channels;

     } else {

         const double *data_ptr = (double *)frame->extended_data[channel];

         for (i = 0; i < frame->nb_samples; i++) {

             rms_value += pow_2(data_ptr[i]);

         }


         rms_value /= frame->nb_samples;

     }


     return FFMAX(sqrt(rms_value), DBL_EPSILON);

 }


 static double get_max_local_gain(DynamicAudioNormalizerContext *s, AVFrame *frame,

                                  int channel)

 {

     const double maximum_gain = s->peak_value / find_peak_magnitude(frame, channel);

     const double rms_gain = s->target_rms > DBL_EPSILON ? (s->target_rms / compute_frame_rms(frame, channel)) : DBL_MAX;

     return bound(s->max_amplification, FFMIN(maximum_gain, rms_gain));

 }


 static double minimum_filter(cqueue *q)

 {

     double min = DBL_MAX;

     int i;


     for (i = 0; i < cqueue_size(q); i++) {

         min = FFMIN(min, cqueue_peek(q, i));

     }


     return min;

 }


 static double gaussian_filter(DynamicAudioNormalizerContext *s, cqueue *q)

 {

     double result = 0.0;

     int i;


     for (i = 0; i < cqueue_size(q); i++) {

         result += cqueue_peek(q, i) * s->weights[i];

     }


     return result;

 }


 static void update_gain_history(DynamicAudioNormalizerContext *s, int channel,

                                 double current_gain_factor)

 {

     if (cqueue_empty(s->gain_history_original[channel]) ||

         cqueue_empty(s->gain_history_minimum[channel])) {

         const int pre_fill_size = s->filter_size / 2;

         const double initial_value = s->alt_boundary_mode ? current_gain_factor : 1.0;


         s->prev_amplification_factor[channel] = initial_value;


         while (cqueue_size(s->gain_history_original[channel]) < pre_fill_size) {

             cqueue_enqueue(s->gain_history_original[channel], initial_value);

         }

     }


     cqueue_enqueue(s->gain_history_original[channel], current_gain_factor);


     while (cqueue_size(s->gain_history_original[channel]) >= s->filter_size) {

         double minimum;

         av_assert0(cqueue_size(s->gain_history_original[channel]) == s->filter_size);


         if (cqueue_empty(s->gain_history_minimum[channel])) {

             const int pre_fill_size = s->filter_size / 2;

             double initial_value = s->alt_boundary_mode ? cqueue_peek(s->gain_history_original[channel], 0) : 1.0;

             int input = pre_fill_size;


             while (cqueue_size(s->gain_history_minimum[channel]) < pre_fill_size) {

                 input++;

                 initial_value = FFMIN(initial_value, cqueue_peek(s->gain_history_original[channel], input));

                 cqueue_enqueue(s->gain_history_minimum[channel], initial_value);

             }

         }


         minimum = minimum_filter(s->gain_history_original[channel]);


         cqueue_enqueue(s->gain_history_minimum[channel], minimum);


         cqueue_pop(s->gain_history_original[channel]);

     }


     while (cqueue_size(s->gain_history_minimum[channel]) >= s->filter_size) {

         double smoothed;

         av_assert0(cqueue_size(s->gain_history_minimum[channel]) == s->filter_size);

         smoothed = gaussian_filter(s, s->gain_history_minimum[channel]);


         cqueue_enqueue(s->gain_history_smoothed[channel], smoothed);


         cqueue_pop(s->gain_history_minimum[channel]);

     }

 }


 static inline double update_value(double new, double old, double aggressiveness)

 {

     av_assert0((aggressiveness >= 0.0) && (aggressiveness <= 1.0));

     return aggressiveness * new + (1.0 - aggressiveness) * old;

 }


 static void perform_dc_correction(DynamicAudioNormalizerContext *s, AVFrame *frame)

 {

     const double diff = 1.0 / frame->nb_samples;

     int is_first_frame = cqueue_empty(s->gain_history_original[0]);

     int c, i;


     for (c = 0; c < s->channels; c++) {

         double *dst_ptr = (double *)frame->extended_data[c];

         double current_average_value = 0.0;

         double prev_value;


         for (i = 0; i < frame->nb_samples; i++)

             current_average_value += dst_ptr[i] * diff;


         prev_value = is_first_frame ? current_average_value : s->dc_correction_value[c];

         s->dc_correction_value[c] = is_first_frame ? current_average_value : update_value(current_average_value, s->dc_correction_value[c], 0.1);


         for (i = 0; i < frame->nb_samples; i++) {

             dst_ptr[i] -= fade(prev_value, s->dc_correction_value[c], i, s->fade_factors);

         }

     }

 }


 static double setup_compress_thresh(double threshold)

 {

     if ((threshold > DBL_EPSILON) && (threshold < (1.0 - DBL_EPSILON))) {

         double current_threshold = threshold;

         double step_size = 1.0;


         while (step_size > DBL_EPSILON) {

             while ((llrint((current_threshold + step_size) * (UINT64_C(1) << 63)) >

                     llrint(current_threshold * (UINT64_C(1) << 63))) &&

                    (bound(current_threshold + step_size, 1.0) <= threshold)) {

                 current_threshold += step_size;

             }


             step_size /= 2.0;

         }


         return current_threshold;

     } else {

         return threshold;

     }

 }


 static double compute_frame_std_dev(DynamicAudioNormalizerContext *s,

                                     AVFrame *frame, int channel)

 {

     double variance = 0.0;

     int i, c;


     if (channel == -1) {

         for (c = 0; c < s->channels; c++) {

             const double *data_ptr = (double *)frame->extended_data[c];


             for (i = 0; i < frame->nb_samples; i++) {

                 variance += pow_2(data_ptr[i]);  // Assume that MEAN is *zero*

             }

         }

         variance /= (s->channels * frame->nb_samples) - 1;

     } else {

         const double *data_ptr = (double *)frame->extended_data[channel];


         for (i = 0; i < frame->nb_samples; i++) {

             variance += pow_2(data_ptr[i]);      // Assume that MEAN is *zero*

         }

         variance /= frame->nb_samples - 1;

     }


     return FFMAX(sqrt(variance), DBL_EPSILON);

 }


 static void perform_compression(DynamicAudioNormalizerContext *s, AVFrame *frame)

 {

     int is_first_frame = cqueue_empty(s->gain_history_original[0]);

     int c, i;


     if (s->channels_coupled) {

         const double standard_deviation = compute_frame_std_dev(s, frame, -1);

         const double current_threshold  = FFMIN(1.0, s->compress_factor * standard_deviation);


         const double prev_value = is_first_frame ? current_threshold : s->compress_threshold[0];

         double prev_actual_thresh, curr_actual_thresh;

         s->compress_threshold[0] = is_first_frame ? current_threshold : update_value(current_threshold, s->compress_threshold[0], (1.0/3.0));


         prev_actual_thresh = setup_compress_thresh(prev_value);

         curr_actual_thresh = setup_compress_thresh(s->compress_threshold[0]);


         for (c = 0; c < s->channels; c++) {

             double *const dst_ptr = (double *)frame->extended_data[c];

             for (i = 0; i < frame->nb_samples; i++) {

                 const double localThresh = fade(prev_actual_thresh, curr_actual_thresh, i, s->fade_factors);

                 dst_ptr[i] = copysign(bound(localThresh, fabs(dst_ptr[i])), dst_ptr[i]);

             }

         }

     } else {

         for (c = 0; c < s->channels; c++) {

             const double standard_deviation = compute_frame_std_dev(s, frame, c);

             const double current_threshold  = setup_compress_thresh(FFMIN(1.0, s->compress_factor * standard_deviation));


             const double prev_value = is_first_frame ? current_threshold : s->compress_threshold[c];

             double prev_actual_thresh, curr_actual_thresh;

             double *dst_ptr;

             s->compress_threshold[c] = is_first_frame ? current_threshold : update_value(current_threshold, s->compress_threshold[c], 1.0/3.0);


             prev_actual_thresh = setup_compress_thresh(prev_value);

             curr_actual_thresh = setup_compress_thresh(s->compress_threshold[c]);


             dst_ptr = (double *)frame->extended_data[c];

             for (i = 0; i < frame->nb_samples; i++) {

                 const double localThresh = fade(prev_actual_thresh, curr_actual_thresh, i, s->fade_factors);

                 dst_ptr[i] = copysign(bound(localThresh, fabs(dst_ptr[i])), dst_ptr[i]);

             }

         }

     }

 }


 static void analyze_frame(DynamicAudioNormalizerContext *s, AVFrame *frame)

 {

     if (s->dc_correction) {

         perform_dc_correction(s, frame);

     }


     if (s->compress_factor > DBL_EPSILON) {

         perform_compression(s, frame);

     }


     if (s->channels_coupled) {

         const double current_gain_factor = get_max_local_gain(s, frame, -1);

         int c;


         for (c = 0; c < s->channels; c++)

             update_gain_history(s, c, current_gain_factor);

     } else {

         int c;


         for (c = 0; c < s->channels; c++)

             update_gain_history(s, c, get_max_local_gain(s, frame, c));

     }

 }


 static void amplify_frame(DynamicAudioNormalizerContext *s, AVFrame *frame)

 {

     int c, i;


     for (c = 0; c < s->channels; c++) {

         double *dst_ptr = (double *)frame->extended_data[c];

         double current_amplification_factor;


         cqueue_dequeue(s->gain_history_smoothed[c], &current_amplification_factor);


         for (i = 0; i < frame->nb_samples; i++) {

             const double amplification_factor = fade(s->prev_amplification_factor[c],

                                                      current_amplification_factor, i,

                                                      s->fade_factors);


             dst_ptr[i] *= amplification_factor;


             if (fabs(dst_ptr[i]) > s->peak_value)

                 dst_ptr[i] = copysign(s->peak_value, dst_ptr[i]);

         }


         s->prev_amplification_factor[c] = current_amplification_factor;

     }

 }


 static int filter_frame(AVFilterLink *inlink, AVFrame *in)

 {

     AVFilterContext *ctx = inlink->dst;

     DynamicAudioNormalizerContext *s = ctx->priv;

     AVFilterLink *outlink = inlink->dst->outputs[0];

     int ret = 0;


     if (!cqueue_empty(s->gain_history_smoothed[0])) {

         AVFrame *out = ff_bufqueue_get(&s->queue);


         amplify_frame(s, out);

         ret = ff_filter_frame(outlink, out);

     }


     analyze_frame(s, in);

     ff_bufqueue_add(ctx, &s->queue, in);


     return ret;

 }


 static int flush_buffer(DynamicAudioNormalizerContext *s, AVFilterLink *inlink,

                         AVFilterLink *outlink)

 {

     AVFrame *out = ff_get_audio_buffer(outlink, s->frame_len);

     int c, i;


     if (!out)

         return AVERROR(ENOMEM);


     for (c = 0; c < s->channels; c++) {

         double *dst_ptr = (double *)out->extended_data[c];


         for (i = 0; i < out->nb_samples; i++) {

             dst_ptr[i] = s->alt_boundary_mode ? DBL_EPSILON : ((s->target_rms > DBL_EPSILON) ? FFMIN(s->peak_value, s->target_rms) : s->peak_value);

             if (s->dc_correction) {

                 dst_ptr[i] *= ((i % 2) == 1) ? -1 : 1;

                 dst_ptr[i] += s->dc_correction_value[c];

             }

         }

     }


     s->delay--;

     return filter_frame(inlink, out);

 }


 static int request_frame(AVFilterLink *outlink)

 {

     AVFilterContext *ctx = outlink->src;

     DynamicAudioNormalizerContext *s = ctx->priv;

     int ret = 0;


     ret = ff_request_frame(ctx->inputs[0]);


     if (ret == AVERROR_EOF && !ctx->is_disabled && s->delay) {

         if (!cqueue_empty(s->gain_history_smoothed[0])) {

             ret = flush_buffer(s, ctx->inputs[0], outlink);

         } else if (s->queue.available) {

             AVFrame *out = ff_bufqueue_get(&s->queue);


             ret = ff_filter_frame(outlink, out);

         }

     }


     return ret;

 }


 static const AVFilterPad avfilter_af_dynaudnorm_inputs[] = {

     {

         .name           = "default",

         .type           = AVMEDIA_TYPE_AUDIO,

         .filter_frame   = filter_frame,

         .config_props   = config_input,

         .needs_writable = 1,

     },

     { NULL }

 };


 static const AVFilterPad avfilter_af_dynaudnorm_outputs[] = {

     {

         .name          = "default",

         .type          = AVMEDIA_TYPE_AUDIO,

         .request_frame = request_frame,

     },

     { NULL }

 };


 AVFilter ff_af_dynaudnorm = {

     .name          = "dynaudnorm",

     .description   = NULL_IF_CONFIG_SMALL("Dynamic Audio Normalizer."),

     .query_formats = query_formats,

     .priv_size     = sizeof(DynamicAudioNormalizerContext),

     .init          = init,

     .uninit        = uninit,

     .inputs        = avfilter_af_dynaudnorm_inputs,

     .outputs       = avfilter_af_dynaudnorm_outputs,

     .priv_class    = &dynaudnorm_class,

 };

ff_bufqueue_get
static AVFrame * ff_bufqueue_get(struct FFBufQueue *queue)
Get the first buffer from the queue and remove it.
Definition: bufferqueue.h:98

avfilter_af_dynaudnorm_inputs
static const AVFilterPad avfilter_af_dynaudnorm_inputs[]
Definition: af_dynaudnorm.c:725

DynamicAudioNormalizerContext::channels
int channels
Definition: af_dynaudnorm.c:68

FLAGS
#define FLAGS
Definition: af_dynaudnorm.c:77

bound
static double bound(const double threshold, const double val)
Definition: af_dynaudnorm.c:349

NULL
#define NULL
Definition: coverity.c:32

ff_set_common_channel_layouts
int ff_set_common_channel_layouts(AVFilterContext *ctx, AVFilterChannelLayouts *layouts)
A helper for query_formats() which sets all links to the same list of channel layouts/sample rates...
Definition: formats.c:549

val
const char const char void * val
Definition: avisynth_c.h:771

compute_frame_rms
static double compute_frame_rms(AVFrame *frame, int channel)
Definition: af_dynaudnorm.c:377

audio.h

AVFrame
This structure describes decoded (raw) audio or video data.
Definition: frame.h:226

AVOption
AVOption.
Definition: opt.h:246

CONST
#define CONST(name, help, val, unit)
Definition: vf_bwdif.c:534

cqueue_empty
static int cqueue_empty(cqueue *q)
Definition: af_dynaudnorm.c:186

avfilter_af_dynaudnorm_outputs
static const AVFilterPad avfilter_af_dynaudnorm_outputs[]
Definition: af_dynaudnorm.c:736

pow_2
static double pow_2(const double value)
Definition: af_dynaudnorm.c:344

erf
static double erf(double z)
erf function Algorithm taken from the Boost project, source: http://www.boost.org/doc/libs/1_46_1/boo...
Definition: libm.h:121

avfilter.h
Main libavfilter public API header.

DynamicAudioNormalizerContext::gain_history_smoothed
cqueue ** gain_history_smoothed
Definition: af_dynaudnorm.c:73

AV_OPT_TYPE_INT
Definition: opt.h:223

AVFilterLink::max_samples
int max_samples
Maximum number of samples to filter at once.
Definition: avfilter.h:568

DynamicAudioNormalizerContext::delay
int delay
Definition: af_dynaudnorm.c:69

cqueue_size
static int cqueue_size(cqueue *q)
Definition: af_dynaudnorm.c:181

AV_SAMPLE_FMT_NONE
Definition: samplefmt.h:59

cqueue::first
int first
Definition: af_dynaudnorm.c:43

AV_SAMPLE_FMT_DBLP
double, planar
Definition: samplefmt.h:70

filter_frame
static int filter_frame(AVFilterLink *inlink, AVFrame *in)
Definition: af_dynaudnorm.c:659

get_max_local_gain
static double get_max_local_gain(DynamicAudioNormalizerContext *s, AVFrame *frame, int channel)
Definition: af_dynaudnorm.c:404

analyze_frame
static void analyze_frame(DynamicAudioNormalizerContext *s, AVFrame *frame)
Definition: af_dynaudnorm.c:610

precalculate_fade_factors
static void precalculate_fade_factors(double *fade_factors[2], int frame_len)
Definition: af_dynaudnorm.c:142

AVFilterContext::is_disabled
int is_disabled
the enabled state from the last expression evaluation
Definition: avfilter.h:385

DynamicAudioNormalizerContext::prev_amplification_factor
double * prev_amplification_factor
Definition: af_dynaudnorm.c:62

DynamicAudioNormalizerContext::queue
struct FFBufQueue queue
Definition: af_dynaudnorm.c:49

request_frame
static int request_frame(AVFilterLink *outlink)
Definition: af_dynaudnorm.c:704

av_calloc
void * av_calloc(size_t nmemb, size_t size)
Non-inlined equivalent of av_mallocz_array().
Definition: mem.c:244

config_input
static int config_input(AVFilterLink *inlink)
Definition: af_dynaudnorm.c:287

ff_make_format_list
AVFilterFormats * ff_make_format_list(const int *fmts)
Create a list of supported formats.
Definition: formats.c:283

FFBufQueue
Structure holding the queue.
Definition: bufferqueue.h:49

AVFilterPad::name
const char * name
Pad name.
Definition: internal.h:60

AVFilterContext::inputs
AVFilterLink ** inputs
array of pointers to input links
Definition: avfilter.h:346

av_assert0
#define av_assert0(cond)
assert() equivalent, that is always enabled.
Definition: avassert.h:37

ff_filter_frame
int ff_filter_frame(AVFilterLink *link, AVFrame *frame)
Send a frame of data to the next filter.
Definition: avfilter.c:1080

av_cold
#define av_cold
Definition: attributes.h:82

av_malloc
#define av_malloc(s)
Definition: tableprint_vlc.h:31

av_assert2
#define av_assert2(cond)
assert() equivalent, that does lie in speed critical code.
Definition: avassert.h:64

opt.h
AVOptions.

DynamicAudioNormalizerContext
Definition: af_dynaudnorm.c:46

gaussian_filter
static double gaussian_filter(DynamicAudioNormalizerContext *s, cqueue *q)
Definition: af_dynaudnorm.c:424

cqueue::elements
double * elements
Definition: af_dynaudnorm.c:40

frame
static AVFrame * frame
Definition: demuxing_decoding.c:53

DynamicAudioNormalizerContext::compress_threshold
double * compress_threshold
Definition: af_dynaudnorm.c:64

DynamicAudioNormalizerContext::filter_size
int filter_size
Definition: af_dynaudnorm.c:53

c1
static const uint64_t c1
Definition: murmur3.c:49

AVERROR_EOF
#define AVERROR_EOF
End of file.
Definition: error.h:55

float.h

size
ptrdiff_t size
Definition: opengl_enc.c:101

uninit
static av_cold void uninit(AVFilterContext *ctx)
Definition: af_dynaudnorm.c:258

DynamicAudioNormalizerContext::gain_history_minimum
cqueue ** gain_history_minimum
Definition: af_dynaudnorm.c:72

cqueue_free
static void cqueue_free(cqueue *q)
Definition: af_dynaudnorm.c:174

av_log
#define av_log(a,...)
Definition: tableprint_vlc.h:28

AVFilterPad
A filter pad used for either input or output.
Definition: internal.h:54

AVFilterLink
A link between two filters.
Definition: avfilter.h:439

DynamicAudioNormalizerContext::peak_value
double peak_value
Definition: af_dynaudnorm.c:58

DynamicAudioNormalizerContext::gain_history_original
cqueue ** gain_history_original
Definition: af_dynaudnorm.c:71

flush_buffer
static int flush_buffer(DynamicAudioNormalizerContext *s, AVFilterLink *inlink, AVFilterLink *outlink)
Definition: af_dynaudnorm.c:679

query_formats
static int query_formats(AVFilterContext *ctx)
Definition: af_dynaudnorm.c:106

cqueue_peek
static double cqueue_peek(cqueue *q, int index)
Definition: af_dynaudnorm.c:204

AV_LOG_ERROR
#define AV_LOG_ERROR
Something went wrong and cannot losslessly be recovered.
Definition: log.h:176

ff_set_common_formats
int ff_set_common_formats(AVFilterContext *ctx, AVFilterFormats *formats)
A helper for query_formats() which sets all links to the same list of formats.
Definition: formats.c:568

init_gaussian_filter
static void init_gaussian_filter(DynamicAudioNormalizerContext *s)
Definition: af_dynaudnorm.c:231

AVFILTER_DEFINE_CLASS
AVFILTER_DEFINE_CLASS(dynaudnorm)

AVFilterLink::min_samples
int min_samples
Minimum number of samples to filter at once.
Definition: avfilter.h:562

AVFilterLink::sample_rate
int sample_rate
samples per second
Definition: avfilter.h:454

ff_get_audio_buffer
AVFrame * ff_get_audio_buffer(AVFilterLink *link, int nb_samples)
Request an audio samples buffer with a specific set of permissions.
Definition: audio.c:86

AVERROR
#define AVERROR(e)
Definition: error.h:43

NULL_IF_CONFIG_SMALL
#define NULL_IF_CONFIG_SMALL(x)
Return NULL if CONFIG_SMALL is true, otherwise the argument without modification. ...
Definition: internal.h:186

AVFilterContext::priv
void * priv
private data for use by the filter
Definition: avfilter.h:353

AV_LOG_DEBUG
#define AV_LOG_DEBUG
Stuff which is only useful for libav* developers.
Definition: log.h:197

AVMEDIA_TYPE_AUDIO
Definition: avutil.h:202

avassert.h
simple assert() macros that are a bit more flexible than ISO C assert().

normalize.adjust
tuple adjust
Definition: normalize.py:25

DynamicAudioNormalizerContext::frame_len
int frame_len
Definition: af_dynaudnorm.c:51

OFFSET
#define OFFSET(x)
Definition: af_dynaudnorm.c:76

offset
static const uint8_t offset[127][2]
Definition: vf_spp.c:92

FFMAX
#define FFMAX(a, b)
Definition: common.h:94

exp
int8_t exp
Definition: eval.c:72

DynamicAudioNormalizerContext::compress_factor
double compress_factor
Definition: af_dynaudnorm.c:61

AVFrame::channels
int channels
number of audio channels, only used for audio.
Definition: frame.h:531

FFMIN
#define FFMIN(a, b)
Definition: common.h:96

DynamicAudioNormalizerContext::channels_coupled
int channels_coupled
Definition: af_dynaudnorm.c:55

value
GLsizei GLboolean const GLfloat * value
Definition: opengl_enc.c:109

perform_dc_correction
static void perform_dc_correction(DynamicAudioNormalizerContext *s, AVFrame *frame)
Definition: af_dynaudnorm.c:493

ctx
AVFormatContext * ctx
Definition: movenc.c:48

AV_OPT_TYPE_BOOL
Definition: opt.h:240

DynamicAudioNormalizerContext::fade_factors
double * fade_factors[2]
Definition: af_dynaudnorm.c:65

s
#define s(width, name)
Definition: cbs_vp9.c:257

cqueue::size
int size
Definition: af_dynaudnorm.c:41

AVFilterLink::src
AVFilterContext * src
source filter
Definition: avfilter.h:440

AVFilterLink::partial_buf_size
int partial_buf_size
Size of the partial buffer to allocate.
Definition: avfilter.h:553

ff_bufqueue_discard_all
static void ff_bufqueue_discard_all(struct FFBufQueue *queue)
Unref and remove all buffers from the queue.
Definition: bufferqueue.h:111

inputs
static const AVFilterPad inputs[]
Definition: af_acontrast.c:193

DynamicAudioNormalizerContext::max_amplification
double max_amplification
Definition: af_dynaudnorm.c:59

outputs
static const AVFilterPad outputs[]
Definition: af_acontrast.c:203

AVFilterChannelLayouts
A list of supported channel layouts.
Definition: formats.h:85

bufferqueue.h

sample_rate
sample_rate
Definition: ffmpeg_filter.c:191

AV_OPT_TYPE_DOUBLE
Definition: opt.h:225

cqueue::nb_elements
int nb_elements
Definition: af_dynaudnorm.c:42

ff_af_dynaudnorm
AVFilter ff_af_dynaudnorm
Definition: af_dynaudnorm.c:745

update_gain_history
static void update_gain_history(DynamicAudioNormalizerContext *s, int channel, double current_gain_factor)
Definition: af_dynaudnorm.c:436

AVSampleFormat
AVSampleFormat
Audio sample formats.
Definition: samplefmt.h:58

FFBufQueue::available
unsigned short available
number of available buffers
Definition: bufferqueue.h:52

in
uint8_t pi<< 24) CONV_FUNC_GROUP(AV_SAMPLE_FMT_FLT, float, AV_SAMPLE_FMT_U8, uint8_t,(*(constuint8_t *) pi-0x80)*(1.0f/(1<< 7))) CONV_FUNC_GROUP(AV_SAMPLE_FMT_DBL, double, AV_SAMPLE_FMT_U8, uint8_t,(*(constuint8_t *) pi-0x80)*(1.0/(1<< 7))) CONV_FUNC_GROUP(AV_SAMPLE_FMT_U8, uint8_t, AV_SAMPLE_FMT_S16, int16_t,(*(constint16_t *) pi >>8)+0x80) CONV_FUNC_GROUP(AV_SAMPLE_FMT_FLT, float, AV_SAMPLE_FMT_S16, int16_t,*(constint16_t *) pi *(1.0f/(1<< 15))) CONV_FUNC_GROUP(AV_SAMPLE_FMT_DBL, double, AV_SAMPLE_FMT_S16, int16_t,*(constint16_t *) pi *(1.0/(1<< 15))) CONV_FUNC_GROUP(AV_SAMPLE_FMT_U8, uint8_t, AV_SAMPLE_FMT_S32, int32_t,(*(constint32_t *) pi >>24)+0x80) CONV_FUNC_GROUP(AV_SAMPLE_FMT_FLT, float, AV_SAMPLE_FMT_S32, int32_t,*(constint32_t *) pi *(1.0f/(1U<< 31))) CONV_FUNC_GROUP(AV_SAMPLE_FMT_DBL, double, AV_SAMPLE_FMT_S32, int32_t,*(constint32_t *) pi *(1.0/(1U<< 31))) CONV_FUNC_GROUP(AV_SAMPLE_FMT_U8, uint8_t, AV_SAMPLE_FMT_FLT, float, av_clip_uint8(lrintf(*(constfloat *) pi *(1<< 7))+0x80)) CONV_FUNC_GROUP(AV_SAMPLE_FMT_S16, int16_t, AV_SAMPLE_FMT_FLT, float, av_clip_int16(lrintf(*(constfloat *) pi *(1<< 15)))) CONV_FUNC_GROUP(AV_SAMPLE_FMT_S32, int32_t, AV_SAMPLE_FMT_FLT, float, av_clipl_int32(llrintf(*(constfloat *) pi *(1U<< 31)))) CONV_FUNC_GROUP(AV_SAMPLE_FMT_U8, uint8_t, AV_SAMPLE_FMT_DBL, double, av_clip_uint8(lrint(*(constdouble *) pi *(1<< 7))+0x80)) CONV_FUNC_GROUP(AV_SAMPLE_FMT_S16, int16_t, AV_SAMPLE_FMT_DBL, double, av_clip_int16(lrint(*(constdouble *) pi *(1<< 15)))) CONV_FUNC_GROUP(AV_SAMPLE_FMT_S32, int32_t, AV_SAMPLE_FMT_DBL, double, av_clipl_int32(llrint(*(constdouble *) pi *(1U<< 31))))#defineSET_CONV_FUNC_GROUP(ofmt, ifmt) staticvoidset_generic_function(AudioConvert *ac){}voidff_audio_convert_free(AudioConvert **ac){if(!*ac) return;ff_dither_free(&(*ac) ->dc);av_freep(ac);}AudioConvert *ff_audio_convert_alloc(AVAudioResampleContext *avr, enumAVSampleFormatout_fmt, enumAVSampleFormatin_fmt, intchannels, intsample_rate, intapply_map){AudioConvert *ac;intin_planar, out_planar;ac=av_mallocz(sizeof(*ac));if(!ac) returnNULL;ac->avr=avr;ac->out_fmt=out_fmt;ac->in_fmt=in_fmt;ac->channels=channels;ac->apply_map=apply_map;if(avr->dither_method!=AV_RESAMPLE_DITHER_NONE &&av_get_packed_sample_fmt(out_fmt)==AV_SAMPLE_FMT_S16 &&av_get_bytes_per_sample(in_fmt)>2){ac->dc=ff_dither_alloc(avr, out_fmt, in_fmt, channels, sample_rate, apply_map);if(!ac->dc){av_free(ac);returnNULL;}returnac;}in_planar=ff_sample_fmt_is_planar(in_fmt, channels);out_planar=ff_sample_fmt_is_planar(out_fmt, channels);if(in_planar==out_planar){ac->func_type=CONV_FUNC_TYPE_FLAT;ac->planes=in_planar?ac->channels:1;}elseif(in_planar) ac->func_type=CONV_FUNC_TYPE_INTERLEAVE;elseac->func_type=CONV_FUNC_TYPE_DEINTERLEAVE;set_generic_function(ac);if(ARCH_AARCH64) ff_audio_convert_init_aarch64(ac);if(ARCH_ARM) ff_audio_convert_init_arm(ac);if(ARCH_X86) ff_audio_convert_init_x86(ac);returnac;}intff_audio_convert(AudioConvert *ac, AudioData *out, AudioData *in){intuse_generic=1;intlen=in->nb_samples;intp;if(ac->dc){av_log(ac->avr, AV_LOG_TRACE,"%dsamples-audio_convert:%sto%s(dithered)\n", len, av_get_sample_fmt_name(ac->in_fmt), av_get_sample_fmt_name(ac->out_fmt));returnff_convert_dither(ac-> in
Definition: audio_convert.c:194

compute_frame_std_dev
static double compute_frame_std_dev(DynamicAudioNormalizerContext *s, AVFrame *frame, int channel)
Definition: af_dynaudnorm.c:538

llrint
#define llrint(x)
Definition: libm.h:394

init
static av_cold int init(AVFilterContext *ctx)
Definition: af_dynaudnorm.c:94

AVClass
Describe the class of an AVClass context structure.
Definition: log.h:67

AVFilter
Filter definition.
Definition: avfilter.h:144

index
int index
Definition: gxfenc.c:89

DynamicAudioNormalizerContext::dc_correction_value
double * dc_correction_value
Definition: af_dynaudnorm.c:63

cqueue
Definition: af_dynaudnorm.c:39

AVFilter::name
const char * name
Filter name.
Definition: avfilter.h:148

copysign
static av_always_inline double copysign(double x, double y)
Definition: libm.h:68

setup_compress_thresh
static double setup_compress_thresh(double threshold)
Definition: af_dynaudnorm.c:516

AVFilterContext::outputs
AVFilterLink ** outputs
array of pointers to output links
Definition: avfilter.h:350

layouts
enum MovChannelLayoutTag * layouts
Definition: mov_chan.c:434

ff_all_samplerates
AVFilterFormats * ff_all_samplerates(void)
Definition: formats.c:395

DynamicAudioNormalizerContext::weights
double * weights
Definition: af_dynaudnorm.c:66

find_peak_magnitude
static double find_peak_magnitude(AVFrame *frame, int channel)
Definition: af_dynaudnorm.c:355

cqueue_pop
static int cqueue_pop(cqueue *q)
Definition: af_dynaudnorm.c:221

c
static double c[64]
Definition: vsrc_mptestsrc.c:87

minimum_filter
static double minimum_filter(cqueue *q)
Definition: af_dynaudnorm.c:412

channel
channel
Use these values when setting the channel map with ebur128_set_channel().
Definition: ebur128.h:39

c2
static const uint64_t c2
Definition: murmur3.c:50

AVFilterLink::channels
int channels
Number of channels.
Definition: avfilter.h:573

cqueue_enqueue
static int cqueue_enqueue(cqueue *q, double element)
Definition: af_dynaudnorm.c:191

fade
static double fade(double prev, double next, int pos, double *fade_factors[2])
Definition: af_dynaudnorm.c:338

diff
static av_always_inline int diff(const uint32_t a, const uint32_t b)
Definition: vf_palettegen.c:136

av_free
#define av_free(p)
Definition: tableprint_vlc.h:34

AVFilterLink::dst
AVFilterContext * dst
dest filter
Definition: avfilter.h:443

update_value
static double update_value(double new, double old, double aggressiveness)
Definition: af_dynaudnorm.c:487

DynamicAudioNormalizerContext::dc_correction
int dc_correction
Definition: af_dynaudnorm.c:54

AVFilterFormats
A list of supported formats for one end of a filter link.
Definition: formats.h:64

lrint
#define lrint
Definition: tablegen.h:53

DynamicAudioNormalizerContext::alt_boundary_mode
int alt_boundary_mode
Definition: af_dynaudnorm.c:56

AVFilterContext
An instance of a filter.
Definition: avfilter.h:338

sample_fmts
static enum AVSampleFormat sample_fmts[]
Definition: adpcmenc.c:701

out
FILE * out
Definition: movenc.c:54

av_freep
#define av_freep(p)
Definition: tableprint_vlc.h:35

M_PI
#define M_PI
Definition: mathematics.h:52

ff_bufqueue_add
static void ff_bufqueue_add(void *log, struct FFBufQueue *queue, AVFrame *buf)
Add a buffer to the queue.
Definition: bufferqueue.h:71

DynamicAudioNormalizerContext::frame_len_msec
int frame_len_msec
Definition: af_dynaudnorm.c:52

av_malloc_array
#define av_malloc_array(a, b)
Definition: tableprint_vlc.h:32

ff_request_frame
int ff_request_frame(AVFilterLink *link)
Request an input frame from the filter at the other end of the link.
Definition: avfilter.c:407

formats
formats
Definition: signature.h:48

cqueue_create
static cqueue * cqueue_create(int size)
Definition: af_dynaudnorm.c:153

dynaudnorm_options
static const AVOption dynaudnorm_options[]
Definition: af_dynaudnorm.c:79

internal.h
internal API functions

ff_all_channel_counts
AVFilterChannelLayouts * ff_all_channel_counts(void)
Construct an AVFilterChannelLayouts coding for any channel layout, with known or unknown disposition...
Definition: formats.c:410

cqueue_dequeue
static int cqueue_dequeue(cqueue *q, double *element)
Definition: af_dynaudnorm.c:210

AVFrame::extended_data
uint8_t ** extended_data
pointers to the data planes/channels.
Definition: frame.h:273

min
float min
Definition: vorbis_enc_data.h:456

frame_size
static int frame_size(int sample_rate, int frame_len_msec)
Definition: af_dynaudnorm.c:136

AVFrame::nb_samples
int nb_samples
number of audio samples (per channel) described by this frame
Definition: frame.h:292

for
for(j=16;j >0;--j)
Definition: h264pred_template.c:469

ff_set_common_samplerates
int ff_set_common_samplerates(AVFilterContext *ctx, AVFilterFormats *samplerates)
Definition: formats.c:556

amplify_frame
static void amplify_frame(DynamicAudioNormalizerContext *s, AVFrame *frame)
Definition: af_dynaudnorm.c:634

perform_compression
static void perform_compression(DynamicAudioNormalizerContext *s, AVFrame *frame)
Definition: af_dynaudnorm.c:565

DynamicAudioNormalizerContext::target_rms
double target_rms
Definition: af_dynaudnorm.c:60