蜜桃av色欲a片精品一区,麻豆aⅴ精品无码一区二区,亚洲人成网站在线播放影院在线,亚洲 素人 字幕 在线 最新

微立頂科技

新聞資訊

創(chuàng)新 服務(wù) 價(jià)值

  PP-OCRv6正式發(fā)布,精度全面躍升

發(fā)布日期:2026/6/18 23:49:16      瀏覽量:

百度飛槳 PaddleOCR 團(tuán)隊(duì)正式開(kāi)源 PP-OCRv6,PP-OCR 系列第六代文本檢測(cè)識(shí)別模型。本次首次推出 Tiny(1.5M)、Small(7.7M)、Medium(34.5M)三檔模型,覆蓋瀏覽器端、嵌入式設(shè)備到服務(wù)器的全算力平臺(tái)。相比 PP-OCRv5 同級(jí)別模型,文字檢測(cè)精度提升 4.9%、識(shí)別精度提升 5.1%;其中 Medium 檔在 Intel Xeon CPU 上端到端時(shí)延 1.40s,達(dá)到 PP-OCRv5_Server 的 5.2 倍速度,Tiny 檔在瀏覽器端單圖最低僅 97ms。單模型支持語(yǔ)言從 4 種擴(kuò)展到 50 種,并新增電路板、數(shù)碼管、CAD 圖紙、噴碼點(diǎn)陣字符等工業(yè)場(chǎng)景。


開(kāi)源地址:
PaddleOCR官網(wǎng):https://paddleocr.com
Github:https://github.com/PaddlePaddle/PaddleOCR
ModelScope:https://modelscope.cn/collectio

01 PP-OCRv6特性速覽
1. 首次三檔模型,全算力覆蓋:PP-OCR系列首次推出三檔模型:Tiny(1.5M)、small(7.7M)、medium(34.5M)。從瀏覽器端、嵌入式設(shè)備到服務(wù)器,三檔模型覆蓋幾乎所有主流算力平臺(tái),按需選擇,開(kāi)箱即用。

*2. 精度跨越式提升:*文字檢測(cè)精度較PP-OCRv5同級(jí)別模型提升4.9%,文字識(shí)別精度較PP-OCRv5同級(jí)別模型提升5.1%。不是微調(diào)級(jí)別的漲點(diǎn),而是跨越式的代際提升。

*3. CPU推理速度顯著提升:*在同級(jí)別模型中,PP-OCRv6_medium的端到端時(shí)延僅為1.40s(基于 Intel Xeon 與 OpenVINO 優(yōu)化),推理速度達(dá)到了前代PP-OCRv5_Server的5.2倍!而超輕量級(jí)的tiny檔表現(xiàn)更為炸裂,在純前端瀏覽器環(huán)境的極低算力下,直接轟出了單圖97ms的驚人成績(jī)!

*4. 場(chǎng)景覆蓋大幅擴(kuò)展:*單模型支持50種語(yǔ)言,遠(yuǎn)超PP-OCRv5單模型的4種語(yǔ)言。此外,新增電路板、數(shù)碼管、CAD圖紙、噴碼點(diǎn)陣字符等多種工業(yè)場(chǎng)景的文字檢測(cè)與識(shí)別,真實(shí)復(fù)雜場(chǎng)景適用性大幅增強(qiáng)。

*5. 魯棒性史上最高:*在文字檢測(cè)多尺寸預(yù)測(cè)上,預(yù)測(cè)一致性方差僅5.19%,較PP-OCRv5降低35%;在文字識(shí)別邊緣尺寸擾動(dòng)評(píng)估集上,預(yù)測(cè)一致性較PP-OCRv5提升20.5%。

02 效果預(yù)覽
1.文本檢測(cè)(與PP-OCRv5和部分大模型的對(duì)比)

03 快速開(kāi)始
安裝飛槳框架與 PaddleOCR(3.7.0 及以上版本):

python -m pip install paddlepaddle==3.2.1 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
python -m pip install "paddleocr>=3.7.0"
在命令行快速體驗(yàn) PP-OCRv6 能力(3.7.0 及以上版本的默認(rèn)PP-OCR模型已切換到v6版本):

paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --use_textline_orientation False
也可以調(diào)用 Python API,將 PP-OCRv6 能力集成到下游應(yīng)用中:

from paddleocr import PaddleOCR

ocr = PaddleOCR(
    use_doc_orientation_classify=False,
    use_doc_unwarping=False,
    use_textline_orientation=False,
)
# 指定模型檔位
# ocr = PaddleOCR(
#     text_detection_model_name="PP-OCRv6_tiny_det",
#     text_recognition_model_name="PP-OCRv6_tiny_rec",
#     use_doc_orientation_classify=False,
#     use_doc_unwarping=False,
#     use_textline_orientation=False,
# )

result = ocr.predict("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png")
for res in result:
    res.print()
    res.save_to_img("output")
    res.save_to_json("output")


此外,在 v3.7版本中,模型的推理已經(jīng)廣泛兼容 onnxruntime、transformers后端,你可以根據(jù)你的當(dāng)前實(shí)際環(huán)境,通過(guò)指定engine來(lái)指定特定的推理后端。如使用onnxruntime來(lái)推理,只需要增加engine參數(shù),并指定為”onnxruntime”即可。如:

paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --use_textline_orientation False \
    --engine onnxruntime



  業(yè)務(wù)實(shí)施流程

需求調(diào)研 →

團(tuán)隊(duì)組建和動(dòng)員 →

數(shù)據(jù)初始化 →

調(diào)試完善 →

解決方案和選型 →

硬件網(wǎng)絡(luò)部署 →

系統(tǒng)部署試運(yùn)行 →

系統(tǒng)正式上線 →

合作協(xié)議

系統(tǒng)開(kāi)發(fā)/整合

制作文檔和員工培訓(xùn)

售后服務(wù)

馬上咨詢: 如果您有業(yè)務(wù)方面的問(wèn)題或者需求,歡迎您咨詢!我們帶來(lái)的不僅僅是技術(shù),還有行業(yè)經(jīng)驗(yàn)積累。
QQ: 39764417/308460098     Phone: 13 9800 1 9844 / 135 6887 9550     聯(lián)系人:石先生/雷先生