16 KiB
অডিও রেকর্ড করুন - র্যাস্পবেরি পাই
এই পাঠের এই অংশে, আপনি র্যাস্পবেরি পাই-এ অডিও রেকর্ড করার জন্য কোড লিখবেন। একটি বোতামের মাধ্যমে অডিও রেকর্ডিং নিয়ন্ত্রণ করা হবে।
হার্ডওয়্যার
র্যাস্পবেরি পাই-এ অডিও রেকর্ডিং নিয়ন্ত্রণের জন্য একটি বোতাম প্রয়োজন।
আপনি যে বোতামটি ব্যবহার করবেন তা হলো একটি গ্রোভ বোতাম। এটি একটি ডিজিটাল সেন্সর যা একটি সংকেত চালু বা বন্ধ করে। এই বোতামগুলো এমনভাবে কনফিগার করা যায় যাতে বোতাম চাপলে একটি উচ্চ সংকেত পাঠায় এবং না চাপলে নিম্ন সংকেত পাঠায়, অথবা উল্টোটা।
যদি আপনি মাইক্রোফোন হিসেবে ReSpeaker 2-Mics Pi HAT ব্যবহার করেন, তাহলে বোতাম সংযোগ করার প্রয়োজন নেই কারণ এই HAT-এ একটি বোতাম ইতিমধ্যেই সংযুক্ত থাকে। পরবর্তী অংশে যান।
বোতাম সংযোগ করুন
বোতামটি গ্রোভ বেস হ্যাটের সাথে সংযুক্ত করা যেতে পারে।
কাজ - বোতাম সংযোগ করুন
-
গ্রোভ কেবলের এক প্রান্ত বোতাম মডিউলের সকেটে প্রবেশ করান। এটি শুধুমাত্র একটি নির্দিষ্ট দিকেই প্রবেশ করবে।
-
র্যাস্পবেরি পাই বন্ধ অবস্থায়, গ্রোভ কেবলের অন্য প্রান্তটি পাই-এর সাথে সংযুক্ত গ্রোভ বেস হ্যাটের D5 চিহ্নিত ডিজিটাল সকেটে সংযুক্ত করুন। এই সকেটটি GPIO পিনের পাশে থাকা সকেটের সারির বাম দিক থেকে দ্বিতীয়।
অডিও রেকর্ড করুন
আপনি মাইক্রোফোন থেকে পাইথন কোড ব্যবহার করে অডিও রেকর্ড করতে পারেন।
কাজ - অডিও রেকর্ড করুন
-
পাই চালু করুন এবং এটি বুট হওয়ার জন্য অপেক্ষা করুন।
-
ভিএস কোড চালু করুন, হয় সরাসরি পাই-এ, অথবা রিমোট SSH এক্সটেনশনের মাধ্যমে সংযোগ করে।
-
PyAudio Pip প্যাকেজে অডিও রেকর্ড এবং প্লেব্যাক করার ফাংশন রয়েছে। এই প্যাকেজটি কিছু অডিও লাইব্রেরির উপর নির্ভর করে যা প্রথমে ইনস্টল করতে হবে। টার্মিনালে নিম্নলিখিত কমান্ডগুলো চালান:
sudo apt update sudo apt install libportaudio0 libportaudio2 libportaudiocpp0 portaudio19-dev libasound2-plugins --yes
-
PyAudio Pip প্যাকেজ ইনস্টল করুন।
pip3 install pyaudio
-
smart-timer
নামে একটি নতুন ফোল্ডার তৈরি করুন এবং এই ফোল্ডারেapp.py
নামে একটি ফাইল যোগ করুন। -
এই ফাইলের উপরে নিম্নলিখিত ইমপোর্টগুলো যোগ করুন:
import io import pyaudio import time import wave from grove.factory import Factory
এটি
pyaudio
মডিউল, ওয়েভ ফাইল পরিচালনার জন্য কিছু স্ট্যান্ডার্ড পাইথন মডিউল, এবংgrove.factory
মডিউল থেকে একটি বোতাম ক্লাস তৈরি করার জন্যFactory
ইমপোর্ট করে। -
এর নিচে, একটি গ্রোভ বোতাম তৈরি করার জন্য কোড যোগ করুন।
যদি আপনি ReSpeaker 2-Mics Pi HAT ব্যবহার করেন, তাহলে নিম্নলিখিত কোড ব্যবহার করুন:
# The button on the ReSpeaker 2-Mics Pi HAT button = Factory.getButton("GPIO-LOW", 17)
এটি D17 পোর্টে একটি বোতাম তৈরি করে, যেখানে ReSpeaker 2-Mics Pi HAT-এর বোতাম সংযুক্ত থাকে। এই বোতামটি চাপলে নিম্ন সংকেত পাঠানোর জন্য সেট করা হয়েছে।
যদি আপনি ReSpeaker 2-Mics Pi HAT ব্যবহার না করেন এবং গ্রোভ বোতাম বেস হ্যাটে সংযুক্ত করেন, তাহলে এই কোড ব্যবহার করুন।
button = Factory.getButton("GPIO-HIGH", 5)
এটি D5 পোর্টে একটি বোতাম তৈরি করে যা চাপলে উচ্চ সংকেত পাঠানোর জন্য সেট করা হয়েছে।
-
এর নিচে, অডিও পরিচালনার জন্য PyAudio ক্লাসের একটি ইনস্ট্যান্স তৈরি করুন:
audio = pyaudio.PyAudio()
-
মাইক্রোফোন এবং স্পিকারের জন্য হার্ডওয়্যার কার্ড নম্বর ঘোষণা করুন। এটি সেই নম্বর যা আপনি এই পাঠের আগে
arecord -l
এবংaplay -l
চালিয়ে পেয়েছিলেন।microphone_card_number = <microphone card number> speaker_card_number = <speaker card number>
<microphone card number>
-এর জায়গায় আপনার মাইক্রোফোনের কার্ড নম্বর বসান।<speaker card number>
-এর জায়গায় আপনার স্পিকারের কার্ড নম্বর বসান, যা আপনিalsa.conf
ফাইলে সেট করেছিলেন। -
এর নিচে, অডিও রেকর্ড এবং প্লেব্যাকের জন্য স্যাম্পল রেট ঘোষণা করুন। আপনি যে হার্ডওয়্যার ব্যবহার করছেন তার উপর নির্ভর করে এটি পরিবর্তন করতে হতে পারে।
rate = 48000 #48KHz
যদি পরে এই কোড চালানোর সময় স্যাম্পল রেট সংক্রান্ত ত্রুটি পান, তাহলে এই মানটি
44100
বা16000
-এ পরিবর্তন করুন। মান যত বেশি হবে, শব্দের গুণমান তত ভালো হবে। -
এর নিচে,
capture_audio
নামে একটি নতুন ফাংশন তৈরি করুন। এটি মাইক্রোফোন থেকে অডিও রেকর্ড করার জন্য ডাকা হবে:def capture_audio():
-
এই ফাংশনের ভিতরে, অডিও রেকর্ড করার জন্য নিম্নলিখিত কোড যোগ করুন:
stream = audio.open(format = pyaudio.paInt16, rate = rate, channels = 1, input_device_index = microphone_card_number, input = True, frames_per_buffer = 4096) frames = [] while button.is_pressed(): frames.append(stream.read(4096)) stream.stop_stream() stream.close()
এই কোডটি PyAudio অবজেক্ট ব্যবহার করে একটি অডিও ইনপুট স্ট্রিম খুলবে। এই স্ট্রিমটি মাইক্রোফোন থেকে 16KHz-এ অডিও রেকর্ড করবে, যা 4096 বাইটের বাফারে ধারণ করা হবে।
কোডটি গ্রোভ বোতাম চাপা থাকা অবস্থায় লুপ করবে এবং প্রতিবার 4096 বাইটের বাফারগুলো একটি অ্যারেতে পড়বে।
💁
open
মেথডে পাস করা অপশনগুলো সম্পর্কে আরও জানতে PyAudio ডকুমেন্টেশন দেখুন।বোতাম ছেড়ে দিলে, স্ট্রিমটি বন্ধ হয়ে যাবে।
-
এই ফাংশনের শেষে নিম্নলিখিত কোড যোগ করুন:
wav_buffer = io.BytesIO() with wave.open(wav_buffer, 'wb') as wavefile: wavefile.setnchannels(1) wavefile.setsampwidth(audio.get_sample_size(pyaudio.paInt16)) wavefile.setframerate(rate) wavefile.writeframes(b''.join(frames)) wav_buffer.seek(0) return wav_buffer
এই কোডটি একটি বাইনারি বাফার তৈরি করে এবং সমস্ত রেকর্ড করা অডিও একটি WAV ফাইল হিসেবে এতে লিখে। এটি একটি স্ট্যান্ডার্ড পদ্ধতি যা আনকমপ্রেসড অডিও একটি ফাইলে লেখার জন্য ব্যবহৃত হয়। এই বাফারটি পরে রিটার্ন করা হয়।
-
অডিও বাফার প্লেব্যাক করার জন্য
play_audio
ফাংশনটি যোগ করুন:def play_audio(buffer): stream = audio.open(format = pyaudio.paInt16, rate = rate, channels = 1, output_device_index = speaker_card_number, output = True) with wave.open(buffer, 'rb') as wf: data = wf.readframes(4096) while len(data) > 0: stream.write(data) data = wf.readframes(4096) stream.close()
এই ফাংশনটি একটি আউটপুট স্ট্রিম খুলবে, যা অডিও প্লেব্যাকের জন্য ব্যবহৃত হবে। এটি ইনপুট স্ট্রিমের মতো একই সেটিংস ব্যবহার করে। বাফারটি একটি ওয়েভ ফাইল হিসেবে খোলা হয় এবং 4096 বাইটের চাঙ্কে আউটপুট স্ট্রিমে লেখা হয়, যা অডিও প্লে করে। এরপর স্ট্রিমটি বন্ধ হয়ে যায়।
-
capture_audio
ফাংশনের নিচে নিম্নলিখিত কোড যোগ করুন যা বোতাম চাপা পর্যন্ত লুপ করবে। বোতাম চাপলে অডিও রেকর্ড হবে এবং পরে প্লে হবে।while True: while not button.is_pressed(): time.sleep(.1) buffer = capture_audio() play_audio(buffer)
-
কোডটি চালান। বোতাম চাপুন এবং মাইক্রোফোনে কথা বলুন। কাজ শেষ হলে বোতাম ছেড়ে দিন, এবং আপনি রেকর্ডিং শুনতে পাবেন।
PyAudio ইনস্ট্যান্স তৈরি করার সময় আপনি কিছু ALSA ত্রুটি পেতে পারেন। এটি পাই-এর অডিও ডিভাইসের কনফিগারেশনের কারণে যা আপনার কাছে নেই। এই ত্রুটিগুলো উপেক্ষা করতে পারেন।
pi@raspberrypi:~/smart-timer $ python3 app.py ALSA lib pcm.c:2565:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.front ALSA lib pcm.c:2565:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.rear ALSA lib pcm.c:2565:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.center_lfe ALSA lib pcm.c:2565:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.side
যদি আপনি নিম্নলিখিত ত্রুটি পান:
OSError: [Errno -9997] Invalid sample rate
তাহলে
rate
-কে 44100 বা 16000-এ পরিবর্তন করুন।
💁 আপনি এই কোডটি code-record/pi ফোল্ডারে খুঁজে পেতে পারেন।
😀 আপনার অডিও রেকর্ডিং প্রোগ্রাম সফল হয়েছে!
অস্বীকৃতি:
এই নথিটি AI অনুবাদ পরিষেবা Co-op Translator ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসম্ভব সঠিকতার জন্য চেষ্টা করি, তবে অনুগ্রহ করে মনে রাখবেন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। মূল ভাষায় থাকা নথিটিকে প্রামাণিক উৎস হিসেবে বিবেচনা করা উচিত। গুরুত্বপূর্ণ তথ্যের জন্য, পেশাদার মানব অনুবাদ সুপারিশ করা হয়। এই অনুবাদ ব্যবহারের ফলে কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যা হলে আমরা দায়বদ্ধ থাকব না।