在网络上录制音频,预设:16000Hz 16位

Record audio on web, preset: 16000Hz 16bit

本文关键字:预设 16000Hz 16位 音频 网络      更新时间:2023-09-26
function floatTo16BitPCM(output, offset, input){
  for (var i = 0; i < input.length; i++, offset+=2){
    var s = Math.max(-1, Math.min(1, input[i]));
    output.setInt16(offset, s < 0 ? s * 0x8000 : s * 0x7FFF, true);
  }
}
function writeString(view, offset, string){
  for (var i = 0; i < string.length; i++){
    view.setUint8(offset + i, string.charCodeAt(i));
  }
}
function encodeWAV(samples){
  var buffer = new ArrayBuffer(44 + samples.length * 2);
  var view = new DataView(buffer);
  /* RIFF identifier */
  writeString(view, 0, 'RIFF');
  /* RIFF chunk length */
  view.setUint32(4, 36 + samples.length * 2, true);
  /* RIFF type */
  writeString(view, 8, 'WAVE');
  /* format chunk identifier */
  writeString(view, 12, 'fmt ');
  /* format chunk length */
  view.setUint32(16, 16, true);
  /* sample format (raw) */
  view.setUint16(20, 1, true);
  /* channel count */
  view.setUint16(22, 2, true);
  /* sample rate */
  view.setUint32(24, sampleRate, true);
  /* byte rate (sample rate * block align) */
  view.setUint32(28, sampleRate * 4, true);
  /* block align (channel count * bytes per sample) */
  view.setUint16(32, 4, true);
  /* bits per sample */
  view.setUint16(34, 16, true);
  /* data chunk identifier */
  writeString(view, 36, 'data');
  /* data chunk length */
  view.setUint32(40, samples.length * 2, true);
  floatTo16BitPCM(view, 44, samples);
  return view;
}

嗨,我正在使用此源代码为学校考试录制音频。它以44100Hz和16位录制音频。我想更改录制设置以录制 16000Hz 和 16 位的音频。我尝试将函数编码WAV中的44修改为16,但没有用。

function encodeWAV(samples){
  var buffer = new ArrayBuffer(44 + samples.length * 2);
  var view = new DataView(buffer)

我也试图改变floadRToBitPCM。我试图将 44 更改为 16,但也没有用。

floatTo16BitPCM(view, 44, samples);

你能帮我解决这个问题吗?我不知道如何修改这个源代码。

编辑:

另一种选择(更好的一个IMO)只是选择HTML的MediaRecorder并以.ogg格式录制,演示,它是git repo


我假设您使用此作为来源,就像 jaket 所说,floatTo16BitPCM(view, 44, samples);行与采样率无关......

如果要对数据重新采样,请修改以下内容:

function exportWAV(type){
    var buffers = [];
    for (var channel = 0; channel < numChannels; channel++){
        buffers.push(mergeBuffers(recBuffers[channel], recLength));
    }
    if (numChannels === 2){
        var interleaved = interleave(buffers[0], buffers[1]);
    } else {
        var interleaved = buffers[0];
    }
    var dataview = encodeWAV(interleaved);
    var audioBlob = new Blob([dataview], { type: type });
    this.postMessage(audioBlob);
}

进入这个:

function exportWAV(type, desiredSamplingRate){
    var buffers = [];
    for (var channel = 0; channel < numChannels; channel++){
        var buffer = mergeBuffers(recBuffers[channel], recLength);
        buffer = interpolateArray(buffer, desiredSamplingRate, sampleRate);
        buffers.push(buffer);
    }
    sampleRate = desiredSamplingRate;
    if (numChannels === 2){
        var interleaved = interleave(buffers[0], buffers[1]);
    } else {
        var interleaved = buffers[0];
    }
    var dataview = encodeWAV(interleaved);
    var audioBlob = new Blob([dataview], { type: type });
    this.postMessage(audioBlob);
}

数据重采样代码,

// for changing the sampling rate, data,
function interpolateArray(data, newSampleRate, oldSampleRate) {
    var fitCount = Math.round(data.length*(newSampleRate/oldSampleRate));
    var newData = new Array();
    var springFactor = new Number((data.length - 1) / (fitCount - 1));
    newData[0] = data[0]; // for new allocation
    for ( var i = 1; i < fitCount - 1; i++) {
    var tmp = i * springFactor;
    var before = new Number(Math.floor(tmp)).toFixed();
    var after = new Number(Math.ceil(tmp)).toFixed();
    var atPoint = tmp - before;
    newData[i] = this.linearInterpolate(data[before], data[after], atPoint);
    }
    newData[fitCount - 1] = data[data.length - 1]; // for new allocation
    return newData;
};
function linearInterpolate(before, after, atPoint) {
    return before + (after - before) * atPoint;
};

编辑:如果你不打算改变太多,你可以把它硬编码为

function exportWAV(type){
    var buffers = [], desiredSamplingRate = 16000;

我不相信您可以使用网络音频API控制采样率...它拾取在浏览器外部定义的系统默认采样率......当然,在录制之后,您可以以编程方式更改音频以重新采样到任何采样率...... 大多数音频播放器只能播放标准采样率的媒体...能够渲染 16 kHz 的关闭采样率可能比从 44.1 到 16 kHz 的重采样更具挑战性

您修改了错误的字段。波形文件是一个标头,后跟数据。波形标头通常为 44 字节长。您在示例代码中看到的44值与此相关,而不是与44100 .

在你尚未发布的代码中的某处,sampleRate被定义为 44100。您需要跟踪该定义并将其更改为 16000。根据代码的其余部分和示例的来源,它可能不是那么简单。例如,如果从设备记录样本,并且设备已配置为以 44100 记录,则简单地将保存的波形标记为 16000 不会产生预期的效果。它只会使播放速度太慢 2.75 倍,也就是巴里怀特效果。

您可以像这样更改 init 函数,在这里您可以将默认浏览器采样率克服为 16000 以及指示单声道/立体声的通道,我们也可以更改该通道, 如果是单声道,它将是 1 ,其他明智的两个。

 function init(config) {
            //sampleRate = config.sampleRate;
            sampleRate = 16000;
            debugger;
            //numChannels = config.numChannels;
            numChannels = 1;
            initBuffers();
        }