# Neural Network Runtime Kitç®€ä»‹

## ä½¿ç”¨åœºæ™¯
Neural Network Runtimeï¼ˆNNRt, ç¥žç»ç½‘ç»œè¿è¡Œæ—¶ï¼‰æ˜¯é¢å‘AIé¢†åŸŸçš„è·¨èŠ¯ç‰‡æŽ¨ç†è®¡ç®—è¿è¡Œæ—¶ï¼Œä½œä¸ºä¸é—´æ¡¥æ¢è¿žé€šä¸Šå±‚AIæŽ¨ç†æ¡†æž¶å’Œåº•å±‚åŠ é€ŸèŠ¯ç‰‡ï¼Œå®žçŽ°AIæ¨¡åž‹çš„è·¨èŠ¯ç‰‡æŽ¨ç†è®¡ç®—ã€‚

Neural Network Runtimeçš„NativeæŽ¥å£ä¸»è¦é¢å‘AIæŽ¨ç†æ¡†æž¶çš„å¼€å‘è€…ï¼Œæˆ–è€…å¸Œæœ›ç›´æŽ¥ä½¿ç”¨AIåŠ é€Ÿç¡¬ä»¶å®žçŽ°æ¨¡åž‹æŽ¨ç†åŠ é€Ÿçš„åº”ç”¨å¼€å‘è€…ã€‚

AIæŽ¨ç†æ¡†æž¶å¯ä»¥è°ƒç”¨NNRtçš„æž„å›¾æŽ¥å£å°†æŽ¨ç†æ¡†æž¶çš„æ¨¡åž‹å›¾è½¬æ¢ä¸ºNNRtå†…éƒ¨ä½¿ç”¨çš„æ¨¡åž‹å›¾ï¼Œç„¶åŽè°ƒç”¨NNRtçš„ç¼–è¯‘å’Œæ‰§è¡ŒæŽ¥å£åœ¨NNRtåº•å±‚å¯¹æŽ¥çš„AIåŠ é€Ÿç¡¬ä»¶ä¸Šè¿›è¡Œæ¨¡åž‹æŽ¨ç†ã€‚è¯¥æ–¹å¼å¯ä»¥å®žçŽ°æ— æ„ŸçŸ¥çš„è·¨AIç¡¬ä»¶æŽ¨ç†ï¼Œä½†æ˜¯é¦–æ¬¡åŠ è½½æ¨¡åž‹é€Ÿåº¦è¾ƒæ…¢ã€‚

AIæŽ¨ç†æ¡†æž¶å’Œåº”ç”¨å¼€å‘è€…ä¹Ÿå¯ä»¥æ— éœ€è°ƒç”¨NNRtæž„å›¾æŽ¥å£ï¼Œç›´æŽ¥ä½¿ç”¨æŸæ¬¾å…·ä½“ç¡¬ä»¶å¯¹åº”çš„ç¦»çº¿æ¨¡åž‹åœ¨NNRtä¸Šæ‰§è¡Œæ¨¡åž‹æŽ¨ç†ã€‚è¯¥æ–¹å¼ä»…èƒ½å®žçŽ°åœ¨ç‰¹å®šAIç¡¬ä»¶ä¸Šæ‰§è¡ŒæŽ¨ç†ï¼Œä½†æ˜¯é¦–æ¬¡åŠ è½½æ¨¡åž‹é€Ÿåº¦è¾ƒå¿«ã€‚

## NNRtæž¶æž„

å¦‚å›¾1æ‰€ç¤ºï¼Œé™¤äº†Nativeå¼€æ”¾æŽ¥å£ï¼ŒNNRtè½¯ä»¶æž¶æž„åŒ…å«å¦‚ä¸‹å‡ ä¸ªåŠŸèƒ½æ¨¡å—ï¼š
1. <b>åœ¨çº¿æž„å›¾</b>ï¼šAIæŽ¨ç†æ¡†æž¶éœ€è¦è°ƒç”¨NNRtçš„æž„å›¾æŽ¥å£å°†æŽ¨ç†æ¡†æž¶çš„æ¨¡åž‹å›¾è½¬æ¢ä¸ºNNRtå†…éƒ¨æ¨¡åž‹å›¾ã€‚è€Œç³»ç»Ÿå†…ç½®çš„MindSpore LiteæŽ¨ç†æ¡†æž¶ï¼ˆå…·ä½“å¯å‚è€ƒ[MindSpore Lite Kit](../mindspore/mindspore-lite-guidelines.md)ï¼‰é€šè¿‡MindIRæ¨¡åž‹å›¾å¯¹æŽ¥NNRtã€‚ç”±äºŽMindIRæ¨¡åž‹å›¾å’ŒNNRtå†…éƒ¨æ¨¡åž‹å›¾æ ¼å¼å…¼å®¹ï¼Œå› æ¤MindSpore Liteæ— éœ€è°ƒç”¨NNRtçš„æž„å›¾æŽ¥å£å³å¯å¯¹æŽ¥NNRtã€‚
2. <b>æ¨¡åž‹ç¼–è¯‘</b>ï¼šNNRtå†…éƒ¨æ¨¡åž‹å›¾æˆ–ç¦»çº¿æ¨¡åž‹æ–‡ä»¶éœ€è¦é€šè¿‡NNRtçš„ç¼–è¯‘æŽ¥å£åœ¨åº•å±‚AIç¡¬ä»¶é©±åŠ¨ä¸Šç¼–è¯‘ä¸ºç¡¬ä»¶ç›¸å…³çš„æ¨¡åž‹å¯¹è±¡ï¼ŒåŽç»å°±å¯ä»¥åœ¨è¯¥ç¡¬ä»¶ä¸Šæ‰§è¡Œæ¨¡åž‹æŽ¨ç†ã€‚
3. <b>æ¨¡åž‹æŽ¨ç†</b>ï¼šåŸºäºŽå·²ç¼–è¯‘çš„æ¨¡åž‹å¯¹è±¡åˆ›å»ºæ‰§è¡Œå™¨ï¼Œè®¾ç½®æŽ¨ç†çš„è¾“å…¥å’Œè¾“å‡ºå¼ é‡ï¼Œç„¶åŽåœ¨AIç¡¬ä»¶ä¸Šæ‰§è¡Œæ¨¡åž‹æŽ¨ç†ã€‚
4. <b>å†…å˜ç®¡ç†</b>ï¼šæŽ¨ç†çš„è¾“å…¥å’Œè¾“å‡ºå¼ é‡éœ€è¦åŒ…å«å¯¹åº”çš„æ•°æ®å†…å˜ï¼Œè¯¥æ¨¡å—è´Ÿè´£åœ¨AIç¡¬ä»¶é©±åŠ¨ä¸Šç”³è¯·å…±äº«å†…å˜å¹¶èµ‹ç»™å¼ é‡ï¼Œå¹¶åœ¨å¼ é‡é”€æ¯æ—¶é‡Šæ”¾å¯¹åº”å…±äº«å†…å˜ã€‚é€šè¿‡AIç¡¬ä»¶é©±åŠ¨ä¸Šçš„å…±äº«å†…å˜å¯ä»¥å®žçŽ°è¾“å…¥å’Œè¾“å‡ºæ•°æ®çš„â€œé›¶æ‹·è´â€ï¼Œæå‡æŽ¨ç†æ€§èƒ½ã€‚
5. <b>è®¾å¤‡ç®¡ç†</b>ï¼šè´Ÿè´£å±•ç¤ºNNRtå¯¹æŽ¥çš„AIç¡¬ä»¶ä¿¡æ¯ï¼Œå¹¶æä¾›äº†é€‰æ‹©AIç¡¬ä»¶çš„åŠŸèƒ½ã€‚
6. <b>æ¨¡åž‹ç¼“å˜</b>ï¼šå·²ç¼–è¯‘çš„æ¨¡åž‹å¯¹è±¡å†™æˆæ¨¡åž‹ç¼“å˜æ ¼å¼ï¼Œä¿å˜åœ¨æ–‡ä»¶æˆ–ä¸€æ®µå†…å˜ä¸ã€‚åœ¨ä¸‹ä¸€æ¬¡ç¼–è¯‘æ¨¡åž‹æ—¶ï¼Œå¯ä»¥ç›´æŽ¥ä»Žæ–‡ä»¶æˆ–å†…å˜å½¢å¼çš„æ¨¡åž‹ç¼“å˜ä¸åŠ è½½ï¼Œå¤§å¹…æå‡ç¼–è¯‘é€Ÿåº¦ã€‚
7. <b>ç¦»çº¿æ¨¡åž‹æŽ¨ç†</b>ï¼šé™¤äº†æ”¯æŒé€šè¿‡æž„å›¾æŽ¥å£æž„é€ æ¨¡åž‹å›¾ï¼ŒNNRtä¹Ÿæ”¯æŒç›´æŽ¥ä½¿ç”¨AIç¡¬ä»¶ç›¸å…³çš„æ¨¡åž‹æ–‡ä»¶ï¼ˆç®€ç§°ä¸ºç¦»çº¿æ¨¡åž‹ï¼‰è¿›è¡ŒæŽ¨ç†ã€‚åº”ç”¨å¼€å‘è€…ä½¿ç”¨AIç¡¬ä»¶åŽ‚å•†æä¾›çš„æ¨¡åž‹è½¬æ¢å™¨å°†åŽŸå§‹è®ç»ƒæ¨¡åž‹è½¬æ¢ä¸ºAIç¡¬ä»¶å¯¹åº”çš„ç¦»çº¿æ¨¡åž‹æ–‡ä»¶ï¼Œå¹¶å°†å®ƒéƒ¨ç½²åœ¨åº”ç”¨ç¨‹åºä¸ï¼Œåœ¨åº”ç”¨è¿è¡ŒæœŸé—´é€šè¿‡NNRtçš„ç¦»çº¿æ¨¡åž‹ç¼–è¯‘æŽ¥å£ä¼ å…¥ã€‚ç¦»çº¿æ¨¡åž‹ä»…èƒ½åœ¨å¯¹åº”AIç¡¬ä»¶ä¸Šç¼–è¯‘å’ŒæŽ¨ç†ï¼Œæ— æ³•æ”¯æŒè·¨AIç¡¬ä»¶å…¼å®¹ã€‚ä½†ç”±äºŽç¦»çº¿æ¨¡åž‹å’Œç¡¬ä»¶ç›´æŽ¥ç›¸å…³ï¼Œå› æ¤ç¼–è¯‘é€Ÿåº¦é€šå¸¸å¾ˆå¿«ã€‚

**å›¾1** Neural Network Runtimeæž¶æž„å›¾
!["Neural Network Runtimeæž¶æž„å›¾"](figures/zh-cn_neural_network_runtime_intro.jpg)

## äº®ç‚¹ç‰¹å¾

- NNRté¢å‘AIæŽ¨ç†æ¡†æž¶å’ŒAIåº”ç”¨å¼€æ”¾äº†ç»Ÿä¸€çš„AIåŠ é€Ÿç¡¬ä»¶æŽ¨ç†æŽ¥å£ï¼Œå¯æ”¯æŒæ— æ„ŸçŸ¥çš„è·¨AIç¡¬ä»¶æŽ¨ç†ã€‚
- NNRtæä¾›äº†æž„å›¾æŽ¥å£ï¼Œå¯ä»¥è®©AIæŽ¨ç†æ¡†æž¶å°†å†…éƒ¨æ¨¡åž‹å›¾å¯¹æŽ¥åˆ°NNRtã€‚
- NNRtæä¾›äº†æ¨¡åž‹ç¼–è¯‘ç¼“å˜åŠŸèƒ½ï¼Œå¯å°†æ¨¡åž‹ç¼–è¯‘ç»“æžœä¿å˜ä¸ºç¼“å˜æ–‡ä»¶ï¼Œå¤§å¹…åŠ å¿«æ¨¡åž‹åŠ è½½é€Ÿåº¦ã€‚
- NNRtæä¾›äº†ç¡¬ä»¶ç›¸å…³çš„ç¦»çº¿æ¨¡åž‹åŠ è½½åŠŸèƒ½ï¼Œå¯ç¼©çŸæ¨¡åž‹ç¼–è¯‘æ—¶é—´ï¼Œä½†æ˜¯ä»…å¯åœ¨å¯¹åº”AIç¡¬ä»¶ä¸Šæ‰§è¡Œã€‚
- NNRtæä¾›äº†é…ç½®æŽ¨ç†ä¼˜å…ˆçº§ã€æ€§èƒ½æ¨¡å¼ã€FP16æ¨¡å¼ç‰å¸¸è§ç¡¬ä»¶å±žæ€§ï¼Œä¹Ÿæ”¯æŒé…ç½®ç‰¹å®šç¡¬ä»¶çš„è‡ªå®šä¹‰æ‰©å±•å±žæ€§ã€‚
- NNRté€šè¿‡ç”³è¯·AIç¡¬ä»¶é©±åŠ¨ä¸Šçš„å…±äº«å†…å˜æ¥å®žçŽ°æ•°æ®çš„â€œé›¶æ‹·è´â€ï¼Œæå‡æŽ¨ç†æ€§èƒ½ã€‚

## èƒ½åŠ›èŒƒå›´

- NNRtä»…å¯æä¾›å·²åœ¨åº•å±‚æŽ¥å…¥çš„AIåŠ é€Ÿç¡¬ä»¶çš„AIæŽ¨ç†èƒ½åŠ›ï¼Œä¸æä¾›CPUç‰é€šç”¨ç¡¬ä»¶ä¸Šçš„AIæŽ¨ç†èƒ½åŠ›ã€‚
- NNRtä»…èƒ½æä¾›å¤§å¤šæ•°AIç¡¬ä»¶å…±æœ‰çš„åŸºç¡€AIæŽ¨ç†èƒ½åŠ›å’Œç¡¬ä»¶å±žæ€§é…ç½®ï¼Œä¾‹å¦‚ç¼–è¯‘ã€æ‰§è¡Œã€å†…å˜ç®¡ç†ã€ä¼˜å…ˆçº§ã€æ€§èƒ½æ¨¡å¼ç‰ã€‚å¦‚æžœå¸Œæœ›é…ç½®æŸæ¬¾AIç¡¬ä»¶ç‰¹æœ‰çš„ç¡¬ä»¶å±žæ€§ï¼Œå¯ä»¥é€šè¿‡NNRtæä¾›çš„è‡ªå®šä¹‰æ‰©å±•å±žæ€§æŽ¥å£é…ç½®ï¼Œå…·ä½“å±žæ€§åç§°å’Œå€¼éœ€è¦æŸ¥é˜…ç¡¬ä»¶åŽ‚å•†çš„æ–‡æ¡£ã€‚
- NNRtç›®å‰æ”¯æŒå¸¸ç”¨ç®—å56ä¸ªï¼ŒåŽç»ç‰ˆæœ¬ä¼šé€æ¥å¢žåŠ ã€‚æ³¨æ„NNRtçš„ç®—åå¹¶æ²¡æœ‰å…·ä½“å®žçŽ°ï¼Œä»…ä½œä¸ºå†…éƒ¨æ¨¡åž‹å›¾çš„å…ƒç´ å¯¹æŽ¥åº•å±‚AIç¡¬ä»¶ï¼Œå…·ä½“ç®—åå®žçŽ°å…¶å®žæ˜¯åœ¨AIç¡¬ä»¶é©±åŠ¨ä¸ã€‚
- NNRtç›®å‰ä»…æ”¯æŒåŒæ¥æŽ¨ç†ï¼Œè®¡åˆ’åœ¨åŽç»ç‰ˆæœ¬æ”¯æŒå¼‚æ¥æŽ¨ç†ã€‚
- NNRtä¸æ”¯æŒå¤šçº¿ç¨‹å¹¶å‘æž„å›¾ï¼Œæ˜¯å¦æ”¯æŒå¹¶å‘ç¼–è¯‘å’Œæ‰§è¡Œå–å†³äºŽåº•å±‚ç¡¬ä»¶é©±åŠ¨æ˜¯å¦æ”¯æŒã€‚

## ä¸Žç›¸å…³Kitçš„å…³ç³»

Neural Network Runtime Kitå¯æ”¯æŒç³»ç»Ÿå†…ç½®çš„MindSpore LiteæŽ¨ç†æ¡†æž¶ï¼ˆMindSpore Lite Kitï¼‰ï¼ŒMindSpore Liteå·²å¼€æ”¾äº†é…ç½®NNRtçš„NativeæŽ¥å£ã€‚

MindSpore Liteå¯¹æŽ¥NNRtå¯æ— éœ€æž„å›¾ï¼Œä¸¤è€…å…±äº«åŒä¸€ä»½æ¨¡åž‹å›¾æ ¼å¼ï¼ˆMindIRï¼‰ï¼Œå› æ¤ä½¿ç”¨MindSpore Liteåœ¨NNRtä¸ŠåŠ è½½æ¨¡åž‹å°†å¿«äºŽå…¶ä»–AIæŽ¨ç†æ¡†æž¶ã€‚

æ¤å¤–ï¼ŒMindSpore Liteä¹Ÿæ”¯æŒé€šç”¨ç¡¬ä»¶CPU/GPUä¸ŽNNRt AIåŠ é€Ÿç¡¬ä»¶ä¹‹é—´çš„æ¨¡åž‹å¼‚æž„æŽ¨ç†åŠŸèƒ½ã€‚