Shanghai Neardi Technology Co., Ltd. sales@neardi.com +86 17612192553
ทำไมอุปกรณ์ Edge จำนวนมากขึ้นเรื่อยๆ ถึงพูดถึง NPUs และตัวประมวลผลร่วม? RK3588 เป็น SoC ที่ทรงพลังอยู่แล้วถึง 6 TOPS (INT8) แต่ในฉากที่ซับซ้อน เช่น การอนุมานแบบหลายงาน การทำงานแบบขนานของโมเดล และการวิเคราะห์วิดีโอ AI เพดานการคำนวณของชิปตัวเดียวก็ยังคงมีอยู่ RK1820 ถูกสร้างขึ้นมาเพื่อรับภาระงานส่วนนั้นและบรรเทา “ความวิตกกังวลในการคำนวณ” ของ SoC หลัก ในอุปกรณ์ edge-AI โปรเซสเซอร์โฮสต์ไม่ได้ต่อสู้เพียงลำพังอีกต่อไป เมื่องาน AI เกินขีดความสามารถในการจัดตารางเวลาของ CPU/NPU แบบดั้งเดิม ตัวประมวลผลร่วมจะเข้ามาเงียบๆ และรับภาระงานอัจฉริยะบางส่วน
![]()
RK1820 เป็นตัวประมวลผลร่วมที่สร้างขึ้นเพื่อการอนุมาน AI และการขยายการคำนวณ โดยจับคู่กับ SoC โฮสต์อย่างยืดหยุ่น เช่น RK3588 และ RK3576 และสื่อสารกับพวกมันอย่างมีประสิทธิภาพผ่านอินเทอร์เฟซ PCIe หรือ USB
| หมวดหมู่ความสามารถ | พารามิเตอร์และฟังก์ชันหลัก |
|---|---|
| สถาปัตยกรรมโปรเซสเซอร์ | 3× คอร์ RISC-V 64 บิต; L1 I-cache 32 KB + L1 D-cache 32 KB ต่อคอร์, L2 cache ที่ใช้ร่วมกัน 128 KB; RISC-V H/F/D-precision FPU |
| หน่วยความจำ | DRAM แบนด์วิธสูงบนชิป 2.5 GB + SRAM 512 KB; รองรับภายนอกสำหรับ eMMC 4.51 (HS200), SD 3.0, SPI Flash |
| ตัวแปลงสัญญาณ | การเข้ารหัส JPEG: 16×16–65520×65520, YUV400/420/422/444; การถอดรหัส JPEG: 48×48–65520×65520, รูปแบบ YUV/RGB หลายรูปแบบ |
| NPU | 20 TOPS INT8; ความแม่นยำแบบผสม INT4/INT8/INT16/FP8/FP16/BF16; เฟรมเวิร์ก: TensorFlow/MXNet/PyTorch/Caffe; Qwen2.5-3B (INT4) 67 โทเค็น/วินาที, YOLOv8n (INT8) 125 FPS |
| การสื่อสาร | PCIe 2.1 (2 เลน, 2.5/5 Gbps), USB 3.0 (5 Gbps, ใช้ร่วมกับ PCIe) |
| ฟังก์ชันหลัก | การอนุมาน Edge-AI (การตรวจจับ / การจำแนกประเภท / LLM), การคำนวณทั่วไป RISC-V, การเร่งความเร็ว 2-D กราฟิก (ปรับขนาด / หมุน), ความปลอดภัย AES/SM4 |
ในระบบ RK3588 + RK1820 ท่อส่งงาน AI จะถูกแยกออกเป็นสถาปัตยกรรมสี่ระดับ:
แอปพลิเคชัน → มิดเดิลแวร์ → การดำเนินการตัวประมวลผลร่วม → การควบคุมและการนำเสนอ
โฮสต์ RK3588: จัดการการจัดตารางงาน การประมวลผลข้อมูลเบื้องต้น และผลลัพธ์ โดยควบคุมเวิร์กโฟลว์ทั้งหมด
ตัวประมวลผลร่วม RK1820: ทุ่มเทให้กับการอนุมาน AI ที่มีการคำนวณสูง จับคู่กับโฮสต์ผ่าน PCIe สร้างแบบจำลองความร่วมมือ “การควบคุมเบา + การคำนวณหนัก”
| ขั้นตอน | ตัวแสดง | การกระทำ |
|---|---|---|
| คำขอแอป | RK3588 | การเรียกงาน AI ที่ออกโดยเลเยอร์แอป (การรับรู้/การตรวจจับ) |
| การจัดส่ง | ตัวจัดส่ง RK3588 | ตัดสินใจว่าจะถ่ายโอนไปยังตัวประมวลผลร่วมหรือไม่ |
| การอนุมาน | RK1820 | เรียกใช้การคำนวณโมเดลการเรียนรู้เชิงลึก |
| ส่งคืน | RK1820 → RK3588 | ส่งผลลัพธ์การอนุมานกลับ; โฮสต์แสดงผลหรือดำเนินการต่อ |
เลเยอร์แอปพลิเคชันคือจุดเริ่มต้นของทุกงาน AI โดยแปลข้อกำหนดของผู้ใช้—การวิเคราะห์ภาพ การตรวจจับวัตถุ LLM Q&A ด้าน Edge ฯลฯ—เป็นคำสั่งงานที่ดำเนินการได้ของระบบ และส่งต่อไปยังเลเยอร์มิดเดิลแวร์ผ่าน API มาตรฐาน เลเยอร์นี้จัดการโดยโฮสต์ RK3588 ทั้งหมด ซึ่งจัดการการโต้ตอบของผู้ใช้ ตรรกะทางธุรกิจ และข้อมูลอุปกรณ์ต่อพ่วง
![]()
การรับงาน: รับคำสั่งของผู้ใช้ผ่านกล้อง แผงสัมผัส อีเธอร์เน็ต UART ฯลฯ
การทำให้เป็นมาตรฐานของคำสั่ง: เปลี่ยนอินพุตที่ไม่มีโครงสร้างให้เป็นพารามิเตอร์งานที่มีโครงสร้าง
เลเยอร์มิดเดิลแวร์คือฮับความร่วมมือ: ตัดสินแต่ละงาน จัดสรรทรัพยากร ประมวลผลข้อมูลเบื้องต้น และควบคุมการรับส่งข้อมูลบนบัส ตัดสินใจว่างานจะทำงานบนโฮสต์หรือถูกถ่ายโอนไปยังตัวประมวลผลร่วม
RK3588 เท่านั้น; RK1820 ไม่มีส่วนร่วมในการกำหนดค่า PCIe หรือการจัดการการขัดจังหวะ—เพียงแค่ดำเนินการงานการอนุมานที่ส่งโดยโฮสต์
การจำแนกประเภทและการจัดตารางงาน
การประมวลผลข้อมูลเบื้องต้น
![]()
การควบคุมการสื่อสารบนบัส
เลเยอร์นี้คือแกนกลางของการอนุมาน ขับเคลื่อนโดยตัวประมวลผลร่วม RK1820 เท่านั้น ทุ่มเทให้กับการอนุมาน AI ที่มีการคำนวณสูง
RK1820 ทำงานอยู่; RK3588 ไม่รบกวนการอนุมาน เพียงแค่รอผลลัพธ์ หมดเวลาหรือข้อยกเว้นจัดการโดย RK3588 ผ่านคำสั่งรีเซ็ต PCIe
การรับงานและการเตรียมการ
รับข้อมูล น้ำหนักโมเดล และคำสั่งที่ส่งโดย RK3588 เขียนลงใน DRAM แบนด์วิธสูงในเครื่อง โหลดโมเดล และกำหนดค่า NPU
การคำนวณการอนุมาน NPU
การส่งคืนผลลัพธ์
เลเยอร์นี้คือจุดสิ้นสุดของทุกงาน AI: แปลงผลลัพธ์การอนุมานดิบจาก RK1820 เป็นเอาต์พุตที่มองเห็นได้หรือพร้อมใช้งานทางธุรกิจ และปิดวงจร
RK3588 ทำงานอยู่; RK1820 ให้ข้อมูลการอนุมานดิบเท่านั้น
![]()
การประมวลผลหลังผลลัพธ์
การควบคุมระบบและเอาต์พุตข้อเสนอแนะ
คุณค่าของพลังร่วมกัน: ไม่เพียงแต่เร็วขึ้น แต่ฉลาดขึ้น
| ขั้นตอน | ตัวแสดง | การกระทำ |
|---|---|---|
| คำขอแอป | RK3588 | การเรียกงาน AI ที่ออกโดยเลเยอร์แอป (การรับรู้/การตรวจจับ) |
| การจัดส่ง | ตัวจัดส่ง RK3588 | ตัดสินใจว่าจะถ่ายโอนไปยังตัวประมวลผลร่วมหรือไม่ |
| การอนุมาน | RK1820 | เรียกใช้การคำนวณโมเดลการเรียนรู้เชิงลึก |
| ส่งคืน | RK1820 → RK3588 | ส่งผลลัพธ์การอนุมานกลับ; โฮสต์แสดงผลหรือดำเนินการต่อ |
พูดง่ายๆ ก็คือ: RK3588 ทำหน้าที่ควบคุมและติดตามทุกอย่าง ในขณะที่ RK1820 มอบการคำนวณดิบที่ระเบิดออกมา ร่วมกันทำให้ Edge-AI อุปกรณ์ “ฉลาดขึ้น เร็วขึ้น และไม่ยุ่งยาก”
ติดตามเราเพื่อรับข่าวสาร RK1820 และการอัปเดต SDK บทช่วยสอนใหม่ๆ และการสาธิตพร้อมใช้งาน