本人从事数据标注行业四年时间有余,现在团队规模达近人,直属基地有人,学校团队有人,孵化团队有80人。
编辑
切换为居中
标注基地其中一个办公室
先说结论,数据标注能不能干?答案是可以干,适合在三线以下城市开展,因为现在行业严重内卷导致单价和任务都比较紧俏,所以只能通过人工和场地上面弥补。可能会没有其他网络项目那么暴利,人均月产值左右,有多少人就赚多少,以此类推。
其实现在加入数据标注已经不算最好的时候了,16到19年是行业的蜜月期,不论从单价上还是任务丰富程度上看,都是比较吸引人的,但那时处于闷声发财阶段。真正被外界熟知当成一个项目来卖的,还是在19年以后,因其大量人员涌入,加上甲方自营基地,行业已经有点疲惫了,现在进入沉淀期,大量淘汰掉没有一手业务不专业的团队,行业向着专业化专注化方向发展。
想从事这个行业必须具备一定的资源,比如任务资源,或者人工成本低,或者有政府提供的产业基地免房租免水电,能获得一些政策支持。通俗理解就是要么你自己能找到任务,要么你的人工场地都非常低。两样都不具备就不能加入这个行业了吗?也不是,市场上有一些公司也开放外包加盟,但需要自己多加甄别,了解清楚公司是靠做任务盈利的还是靠加盟盈利的。前期可以先依靠上家公司的资源组建自己的团队,在行业有一定立足之地之后再去对接一手任务甲方。
一首先讲一下数据标注是什么:
年,艾伦图灵(AlanTuring)发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性。年夏,约翰麦卡锡(JohnMcCarthy)、马文明斯基(MarvinMinsky)等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(ArtificialIntelligence,简称AI)”这一概念,标志着人工智能学科的诞生。6年以来,随着大数据、云计算、物联网等信息技术的发展,泛在感知数据和通用图形处理器推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,迎来爆发式增长的新高潮。
编辑
年参与提出人工智能概念的科学家
数据标注通俗来讲就是教系统识别各种物体,系统就像一个三岁的孩子,需要我们把各种物体一个一个告知给他,教会他识别。再遇到相同的场景系统就能精准快速的识别出来,在我们的生活中数据标注应用的场景不尽其数,最常见的就如语音转成文字这个功能,要知道我们地大物博,更是有许多晦涩难懂的方言,为什么能精准的把我们说的话翻译成文字呢?其中就离不开我们的数据标注人员,首先由数据采集人员采集每个地方的语言,然后我们数据标注员再根据语音翻译成文字,再由技术人员组建模型生成系统功能,才能让我们的生活如此便捷。任何一个功能想达到理想的功能,背后都离不开数以万计的工作量,所以数据标注是一个劳动密集型行业,说直白一点就是互联网电子厂,一个萝卜一个坑,一台电脑就是一个人,尽量让电脑不停运转以达到最佳产效。
编辑
数据标注基地其中一个办公室
数据标注行业的优势和弊端有哪些?
数据标注的优势在于门槛低,有一定的电脑基础即可上手操作,适合大批量招人操作,正因为其门槛低,所以导致大量人员加入行业,但行业总体是向上的,数据量仍是供大于求,目前我国的数据需求量在世界排名第一,所以还有大量的机会。对场地的要求也不高,基本满足统一场地统一管理就行,公司投入也仅仅是场地和电脑,电脑配置价位一千左右即可。行业的好处就是一个人可以盈利,十个人也可以盈利,无非是在于资源的对接和人员管理,数据标注是重度劳动密集型产业,所以在三线以下县城或者乡镇有优势。单人的产值一般在到之间,所以有多少人就有多少盈利,比较简单化。
数据标注是一个正向反馈的行业,你有优质的任务,你就能养的起专业规模的团队,你有专业规模的团队,你就能接到优质的任务,如此循环,才能在行业掘金。
怕的就是那种既没有任务资源,又没有专业规模的团队,任务是别人给的,说停就给停了,说没任务就没了,有的接不靠谱的渠道还不给结账,员工挣不到钱人员流动性大,真是内忧外患困难重重。
数据标注行业的优势是:1.投入少,基本有场地有电脑就可盈利。2.可复制性强,一个人能盈利一百个人也可以盈利,能规模化运营。3.属于资源型行业,不需额外投入,任务结算是甲方给的,人是社会招聘的,除了场地和水电几乎没成本。
数据标注行业的弊端是:1.任务是甲方给的,说停就得停,有时候签合同也不一定管用。2.任务存在周期性,一个任务结束没有另一个任务接上,员工都得休息。3.行业属于甲方市场,基本上需求和议价权都在甲方,标注方没有话语权。4.账期问题,很多任务是三个月结账或者半年结账,很考验运营方的资金储备。
编辑
数据标注行业比较知名的平台
数据标注应该怎样运作:
在行业分为团队运作和个人运作,如果是个人,应该怎么做?个人分两种情况,一种是全职一种是兼职,下面先讲全职:
按照人工智能训练师的等级划分《人工智能训练师国家职业技能标注(年版)》相关等级要求。一共分为5个级别,分别是:五级/初级工、四级/中级工、三级/高级工、二级/技师、一级/高级级技师。
编辑
切换为居中
数据标注员
1、初级工,我们可以理解成为是数据标注员,要求达到的数据基本上就是能进行标注就可以。通过他人培训可以理解和使用标注需求。了解人工智能标注规则,熟练数据标注工具,能够对文本,语音,图像,视频,3D点云数据等内容进行标注及审核工作。通常薪资待遇为底薪加提成,或纯计件制。综合月薪一般不超过元,是标注行业的基石,一般要求有耐心有责任心,除极个别任务外几乎没有学历要求,熟练使用电脑即可。
2、中级工,我们可以理解成为是质检员,负责对团队提交的数据进行审核,是比较高压的工作,需要具备自我调节能力,根据甲方标准严格要求团队成员,既要保证合格率还要保证产值,在团队中的作用比较重要,薪资一般比标注员略高一些,虽不用实际动手标注,但一个个挑毛病对个人也是比较大的挑战。
3、高级工,我们可以理解为项目经理,对管辖项目的交付工作负主体责任,负责整个项目的管理,组织并管理团队,指导项目组成员发展,协助不同条线负责人,为公司培养梯队人才。负责组织完成管辖项目或项目群的交付,负责组织实施方案,实施计划的编写,对项目的整体进度和成本质里负责,达成项目预期目标;负责与项目相关人的沟通及关系处理,保障项目验收和收款,促进续签;维护好客户关系,对客户满意度负责。
综上所述可以看到数据标注员的职业规划和上升空间都是有的,但随着行业的发展也要求个人具备综合能力,既“沟通能力”“执行能力”“管理能力”很多有能力的人才因公司业务不稳定留不住流失掉,很可惜,希望行业能更加规范留住人才。
兼职怎么做?兼职可以分为两种,一种是平台的兼职,一种是外包公司的兼职。
数据标注是一个依赖大量人工劳动密集型行业,有很多短周期高密度的任务,这类任务价格一般都不高,因此适合在平台上面发布,依赖平台大量的兼职和工会迅速分包,根据任务不同获得劳动报酬也不同,有共同点是都需要长时间操作,如果自己每天没有超过4小时的时间就不建议做了。
兼职推荐几个大的数据标注外包平台,注册免费,领取任务也免费,但是很难抢到高价任务,因为平台都有自己优先的合作工会,小白很难融入。
兼职主要能做的数据标注外包平台:龙猫众包、百度众测、数据堂
编辑
数据标注的需求方
外包公司的兼职,一般是自己接的任务需要外部消化所以需要外部兼职,但通常高价的任务都是自己正式员工做,价格灵活的才外包。这种兼职的优势是单价比平台的高,缺点是结账问题,项目周期问题。
一般不推荐做数据标注兼职,除非有团队有任务资源,否则就是浪费时间,除非对行业有热爱否则不建议坚持。
数据标注团队应该怎么做:
一般成立不到三个月的公司会存在这样的问题,即:没有核心一手任务,带来的副作用第一是任务单价太低,任务是二包甚至三包四包的价格,自然就难以支撑起公司的利润,导致公司越做越吃力,不赚钱甚至赔钱。第二、任务周期不能把控,有可能做着做着没任务了,或者任务单价要降低了,这样就难以给员工开工资导致离职,离职以后再接任务没有人,所以就倒闭。第三、账期问题,因为很多项目结账周期是两个月或者三个月,甚至有半年还拿不到款项的,员工的工资每个月都要发,自然压力很大。更别提上家跑路的,更是血本无归。
一般三个月内成立的公司会存在这些问题,基本超过三个月以后,团队基本成型,任务专业度也有一定提升,找准靠谱的渠道,一般都会有不错的利润。
数据标注加盟靠谱吗?
从我个人对行业的认知角度来讲,我是不排斥加盟的,前提是公司的资质和任务储备有充足的保障,否则就是割韭菜。
为什么会存在加盟呢,很多人说我给你好好做,你给我任务做不就得了,说这话的人不是傻就是蠢,你试想一下你知道开肯德基能赚钱,去找肯德基谈判,你给我做不就行了,我挣钱了给你分!你觉得可能吗?任务就是钱,任何一家靠做任务盈利的公司都不会轻易把任务外包,除非单价比较低或者本身就是皮包公司。也有例外,关系比较好的亲戚朋友可能会给任务做,但是培训人员的工资也有成本,所以一般抽成或者收费也正常。
你试想一下,我的团队每天正常做任务能产生收益,因为教你要抽出我的一部分精力,结果你还是三分钟热度的,我不能确定你一定会长期跟我做,那我有可能付出的时间成本都收不回,那我凭什么要带你。还有,任务一般都是自己公司的核心机密,有些人凭着机灵劲融入团队套取甲方的联系方式挖墙脚,对公司更得不偿失。还有外部的团队极容易被外面的诱惑吸引,我出一分,他出一毛一,就极有可能跟他做去了,只看到了价格的差别,殊不知整个流程的完善和公司作为背书需要多少成本。
我碰见很多有几个十几个人的团队要跟我合作,我都是直接拒绝,不是我想收费,是我无法从这些人的日后行为避开风险,一开始都是信心满满要干一番事业的,结果没有两天就因为看不进去培训文档,质检问题打回,任务枯燥等问题开始扯皮,要么整改不及时,要么发消息都不带回的,我付出时间付出精力把自己的任务抽出来,结果还不如我自己坐那拉框,所以你就会明白为什么一定有付费加盟。
但是,选择加盟一定要货比三家,最起码要知道现在同时期有几个任务在进行,都是什么任务,单价多少,公司实际经营时间和人数,大概能判别出来公司是不是干实事的。
数据标注的任务种类:
语音:文字转语音,语音转文字,语言识别(翻译)
编辑
语音转写
图片:物体拉框,目的是识别物体
编辑
图片拉框
3D拉框:智能驾驶的底层数据
编辑
3D拉框任务
数据标注在生活中的应用场景:
编辑
(语音转文字,图片转文字)
编辑
(人脸验证)
编辑智能家居
编辑道路交通
编辑监控安防
编辑汽车智能驾驶
编辑农业(自动采摘等)
转载请注明:http://www.0431gb208.com/sjsbszl/5019.html