TensorAudio

पब्लिक क्लास TensorAudio

इनपुट ऑडियो के सैंपल तैयार करने के लिए, रिंग बफ़र और कुछ यूटिलिटी फ़ंक्शन के बारे में बताता है.

यह रिंग बफ़र को बनाए रखता है ऑडियो डेटा इनपुट करें. क्लाइंट `लोड` तरीकों का इस्तेमाल करके, ऑडियो डेटा फ़ीड कर सकते हैं. साथ ही, `getTensorBuffer` तरीके से एग्रीगेट किए गए ऑडियो सैंपल.

ध्यान दें कि यह क्लास सिर्फ़ फ़्लोट (AudioFormat.ENCODING_PCM_16BIT में) या शॉर्ट वीडियो (AudioFormat.ENCODING_PCM_FLOAT में) में इनपुट ऑडियो को हैंडल कर सकती है. यह सभी ऑडियो को अंदरूनी तौर पर बदलता है और सेव करता है PCM फ़्लोट एन्कोडिंग में नमूने.

Kotlin में आम तौर पर इस्तेमाल

   val tensor = TensorAudio.create(format, modelInputLength)
   tensor.load(newData)
   interpreter.run(tensor.getTensorBuffer(), outputBuffer);
 

AudioRecord के साथ एक और सैंपल इस्तेमाल

   val tensor = TensorAudio.create(format, modelInputLength)
   Timer().scheduleAtFixedRate(delay, period) {
     tensor.load(audioRecord)
     interpreter.run(tensor.getTensorBuffer(), outputBuffer)
   }
 

नेस्ट की गई क्लास

क्लास TensorAudio.TensorAudioFormat आने वाले ऑडियो सैंपल के फ़ॉर्मैट का ब्यौरा देने वाले कुछ कॉन्सटेंट को रैप करता है, जैसे कि चैनल और सैंपल रेट.

सार्वजनिक तरीके

स्टैटिक TensorAudio
create(ऑडियो फ़ॉर्मैट फ़ॉर्मैट, int sampleCounts)
यह रिंग बफ़र के साथ TensorAudio इंस्टेंस बनाता है, जिसका साइज़ sampleCounts * है format.getChannelCount().
स्टैटिक TensorAudio
create(TensorAudio.TensorAudioFormat फ़ॉर्मैट, int sampleCounts)
रिंग बफ़र के साथ AudioRecord इंस्टेंस बनाता है, जिसका साइज़ sampleCounts * format.getChannels() है.
TensorAudio.TensorAudioFormat
TensorBuffer
getTensorBuffer()
AudioFormat.ENCODING_PCM_FLOAT में मौजूद सभी ऑडियो सैंपल को होल्ड करके वाला फ़्लोट TensorBuffer लौटाता है
अमान्य
load(short[] src)
यह इनपुट ऑडियो के सैंपल src को ENCODING_PCM_FLOAT में बदलता है. इसके बाद, इसे रिंग में सेव करता है बफ़र.
अमान्य
load(float[] src, intsettingInFloat, intsizeInFloat)
इनपुट ऑडियो के सैंपल src को रिंग बफ़र में सेव करता है.
अमान्य
load(short[] src, int ऑफ़सेटInShort, intsizeInShort)
यह इनपुट ऑडियो के सैंपल src को ENCODING_PCM_FLOAT में बदलता है. इसके बाद, इसे रिंग में सेव करता है बफ़र.
int
load(AudioRecord रिकॉर्ड)
ब्लॉक न करने वाले तरीके से, AudioRecord से नया डेटा लोड करता है.
अमान्य
load(float[] src)
इनपुट ऑडियो के सैंपल src को रिंग बफ़र में सेव करता है.

इनहेरिट किए गए तरीके