'딥러닝 양자화' 태그의 글 목록

[AI반도체-NPU]딥러닝 Quantization(양자화) 성능 최적화(연산)

[Quantize 연산 최적화]대다수의 딥러닝 모델은 부동 소수점, 특히 FP32 기반으로 만들어져 Edge device와 같은 환경에서 사용해야하는 경우 부동 소수점의 값을 정숫값으로 변환하는 작업을 진행해야한다. 이 작업을 NPU칩 내 CPU에서 처리하는데 소요시간이 상당하다.1. 이미지 프로세싱 모델들은 입력값을 이미지로 받음.2. 일반적으로 이미지는 RGB 채널에 대한 8bit 정수 범위의 값들로 구성되어있음.3. 단, 모델에서 input data로 받을땐 8bit 정수범위의 이미지를 부동 소수점으로 변환하고 이를 전달한다.4. 양자화를 진행한다면 부동 소수점으로 변환된 input data를 다시 정숫값으로 변환한다.5. 이를 해결하기 위해 RGB 이미지 값을 모델의 입력으로 바로 받게 된다면 형..

AI/AI반도체 기술인재 선발대회 2024.09.24

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

인공지능_sallang

딥러닝 양자화 2

티스토리툴바