您的数据团队中有哪些不同的角色和技能?

A comprehensive collection of phone data for research analysis.
Post Reply
tanjimajha12
Posts: 199
Joined: Mon Dec 23, 2024 4:56 am

您的数据团队中有哪些不同的角色和技能?

Post by tanjimajha12 »

Jahnavi Mahanta:我关注的领域是 NLP,我最常用的工具/包是 Stanford NLP、Spacy、Gensim。Python 是我使用的核心语言,但现在正在尝试使用 Pytorch。


Jahnavi Mahanta:我们寻找的是能够理解复杂问题、筛选数据并想出合适解决方案的人。从技术上讲,这些职位需要编程知识和定量导向。

帮助描述一些您的团队今 智利手机号码数据库 年正在解决的问题类型的例子?
Jahnavi Mahanta:我目前正在研究的问题与处理非结构化文本数据有关:如何从数据中获取模式、分类、总结、含义提取等。

你如何衡量你的团队的表现?
Jahnavi Mahanta:性能的衡量标准是提供优雅、可扩展和可解释(在可能的范围内)的数据驱动解决方案的能力。

数据科学的行业准备情况
各行业是否希望了解他们能用数据做什么?他们是否拥有所需的数据?
Jahnavi Mahanta:各行各业都意识到了数据的潜力,因此我们看到如今许多公司都拥有专门的数据科学团队。各行各业都在存储数据并采用各种方法来利用这些数据。所有行业都会产生数据,数据量可能有所不同。这取决于他们如何存储和处理数据,以及他们对数据管理和使用采取什么样的心态。那些将数据作为业务战略不可或缺的一部分的公司处于最前沿。

无论是基于行业还是基于技术领域,数据科学面临的三大问题是什么?
Jahnavi Mahanta:

(a) 能够利用非结构化文本数据的力量:许多行业都会生成大量文本数据,这些数据可能包含大量信息,例如监管或法律部门。然而,这些数据大多是非结构化的,但鉴于 NLP 研究的进步,开发可扩展、用户友好的数据产品的空间很大。

(b)医疗和社会领域的问题。计算机视觉技术的进步起到了很大的帮助作用。

(c) 政府领域也有很多应用,包括农业、国防。例如,一个常见的用例是使用卫星图像数据捕获和处理来了解和预测农作物产量。
Post Reply