Đo kiểm năng lực loa thông minh

 

Cốt lõi của loa thông minh là Trợ lý ảo thông minh (IVA), cho phép sử dụng lệnh thoại để chỉ đạo thiết bị thực hiện mọi thứ từ phát nội dung âm thanh — tin tức, nhạc, podcast, v.v. — đến điều khiển các hệ thống tự động hóa trong nhà hoặc thậm chí đặt hàng mua sắm trực tuyến. Điều đáng chú ý là công nghệ IVA tương tự này, với micrô và loa hỗ trợ, đang được thêm vào tất cả các loại thiết bị gia dụng — bộ điều nhiệt, hộp giải mã truyền hình, tủ lạnh — cho phép điều khiển bằng giọng nói và do đó biến chúng thành “thiết bị thông minh”. Rõ ràng, hầu hết các điện thoại thông minh cũng có thể đóng vai trò của một chiếc loa thông minh.

Mặc dù phần này của AP.com và nhiều tài nguyên khác nhau được tìm thấy ở đây, sẽ chủ yếu thảo luận về thử nghiệm loa thông minh, nhưng hầu hết nội dung đều có thể áp dụng như nhau cho danh mục thiết bị thông minh rộng hơn và việc đo lường năng lực âm thanh của chúng.

Việc đo lường năng lực của loa thông minh đưa ra nhiều thách thức, cho dù việc kiểm tra tập trung vào một hệ thống con hay toàn bộ thiết bị. Nhiều thách thức liên quan đến IVA, sự phức tạp của các hệ thống con khác nhau và các đường dẫn tín hiệu âm thanh tiếp theo.

Loa thông minh IVA

Tương tác với loa thông minh bắt đầu bằng “từ đánh thức” hoặc cụm từ cụ thể, sau đó là lệnh. Ở chế độ hoạt động bình thường, loa thông minh ở trạng thái nửa không hoạt động, nhưng luôn "lắng nghe" từ đánh thức, từ này sẽ kích hoạt chúng thu nhận và xử lý lệnh được nói. Về nhận dạng giọng nói, bản thân loa thông minh chỉ có khả năng nhận dạng từ (hoặc cụm từ) đánh thức. Tính năng nhận dạng giọng nói chuyên sâu hơn và xử lý tiếp theo được thực hiện bởi Trợ lý ảo thông minh trên máy chủ được kết nối. Tùy thuộc vào việc đánh giá được thực hiện, từ đánh thức có thể là một phần không thể thiếu của quá trình kiểm tra.

Hệ thống âm thanh con

Loa thông minh chứa một số hệ thống âm thanh con riêng biệt, bao gồm:

-    Mảng micrô (array)

-    Hệ thống loa có cấp nguồn

-    Các thuật toán xử lý tín hiệu (xử lý front-end để định dạng chùm tia, khử nhiễu, v.v.)

Đường dẫn tín hiệu âm thanh

Các đường dẫn âm thanh chính cho loa thông minh là giữa thiết bị và IVA, sử dụng Internet với kết nối Wi-Fi hoặc có dây. Ở phía đầu vào, tín hiệu giọng nói có chứa lệnh đã nói được cảm nhận bằng micrô array của thiết bị, được số hóa và tải lên IVA để xử lý tín hiệu và giải thích lệnh. Ở phía đầu ra, nội dung âm thanh kỹ thuật số được truyền từ máy chủ web đến thiết bị, nơi nó được chuyển đổi từ kỹ thuật số sang tín hiệu tương tự, sau đó cuối cùng thành tín hiệu âm thanh khi được phát qua hệ thống loa của thiết bị. Loa thông minh cũng có thể có một số đường dẫn âm thanh phụ (ví dụ: giắc cắm đầu ra và đầu vào tương tự, kết nối mạng với các loa thông minh khác, v.v.)

Kiểm tra âm thanh

Hệ thống âm thanh con của loa thông minh có vô số thành phần đóng góp vào năng lực tổng thể và chất lượng âm thanh. Ở một số giai đoạn, mỗi thành phần và hệ thống này phải được kiểm tra, sau đó là đánh giá năng lực từ ​​đầu đến cuối của toàn bộ hệ thống loa thông minh.

Việc kiểm tra đường dẫn âm thanh đầu vào và đầu ra chính của loa thông minh có thể khá khó khăn vì những lý do sau:

1. Đầu vào và đầu ra từ loa thông minh đều là âm thanh và kiểm tra âm thanh về bản chất phức tạp hơn kiểm tra âm thanh điện tử (tương tự hoặc kỹ thuật số). Kiểm tra âm thanh yêu cầu micrô đã được hiệu chỉnh, thường là buồng kiểm tra không dội âm và hệ thống loa chất lượng để kích thích micrô DUT.

2. Loa thông minh vốn dĩ là thiết bị vòng lặp mở. Ở phía đầu vào, một tín hiệu (thường là lời nói) được ghi lại, số hóa và truyền đến máy chủ ở đâu đó dưới dạng tệp âm thanh kỹ thuật số. Để đánh giá hiệu suất đường dẫn đầu vào, tệp âm thanh phải được truy xuất từ ​​máy chủ và phân tích so với tín hiệu được tạo ra ngay từ đầu. Ở phía đầu ra, nội dung âm thanh có nguồn gốc dưới dạng tệp âm thanh trên máy chủ được truyền trực tuyến tới thiết bị nơi nó được chuyển đổi thành tương tự và phát trên hệ thống loa của thiết bị. Để đánh giá hiệu suất đường dẫn đầu ra, đầu ra loa của thiết bị phải được đo bằng micrô đo lường và so sánh với tín hiệu gốc từ máy chủ. Tín hiệu gốc thường ở dạng tín hiệu âm thanh được mã hóa (ví dụ: MP3 hoặc AAC), tín hiệu này yêu cầu phải được giải mã trước khi phân tích.

3. Bộ chuyển đổi A / D và D / A trong thiết bị luôn có tốc độ lấy mẫu khác với thiết bị phân tích âm thanh, yêu cầu một số hình thức bù trong quá trình phân tích.

 AppNote: Smart Speaker Acoustic Measurements

Loa thông minh là một loại thiết bị âm thanh tiêu dùng tương đối mới với những đặc điểm riêng biệt khiến việc kiểm tra năng lực âm thanh của chúng trở nên khó khăn. Trong ghi chú ứng dụng dài 17 trang này, chúng tôi cung cấp thông tin tổng quan về phép đo âm thanh của loa thông minh với trọng tâm là đáp ứng tần số - phép đo khách quan quan trọng nhất về chất lượng âm thanh của thiết bị.

Technote 138: Transfer Function Measurements with APx500 Audio Analyzers

Technote 138 thảo luận về phép đo Hàm Truyền được thêm vào phần mềm đo âm thanh APx500 trong phiên bản phát hành 5.0. Chúng tôi cung cấp thông tin cơ bản về các phép đo hàm truyền nói chung, sau đó là một số ví dụ thực tế về việc áp dụng kỹ thuật đo này cho một số vấn đề kiểm tra âm thanh khó khăn.

Một trong những thuộc tính quan trọng của phân tích hàm truyền là nó cung cấp một phương tiện đo đáp ứng tần số của một thiết bị sử dụng bất kỳ tín hiệu băng thông rộng nào, bao gồm cả giọng nói và âm nhạc. Điều này làm cho nó trở thành một lựa chọn lý tưởng để phân tích các thiết bị được sử dụng cho giao tiếp bằng giọng nói (tức là loa thông minh, điện thoại thông minh, micrô tai nghe, v.v.). Nhiều thiết bị trong số này kết hợp các thuật toán DSP yêu cầu sử dụng tín hiệu giọng nói và một số được thiết kế để chặn hoàn toàn các tín hiệu hình sin. Phân tích hàm truyền giúp đơn giản hóa đáng kể việc đo đáp tuyến tần số của các thiết bị như vậy.

Smart Speaker Audio Test

Video ngắn gọn này cung cấp tổng quan về thử nghiệm loa thông minh trong bối cảnh AP phát hành phần mềm sắp tới. Bản phát hành sẽ bổ sung khả năng sử dụng quét-log sin - còn được gọi là tín hiệu chirp hoặc quét liên tục - trong thiết lập kiểm tra vòng mở. (Bao gồm phần trình diễn âm thanh ngắn gọn tại thời điểm 2:10.)

 

(Dịch bởi Google Translate)