百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

Excel中的4类数据清洗函数,让数据分析更高效,还不掌握就Out

yuyutoo 2024-10-25 19:14 26 浏览 0 评论

Excel作为数据分析最常用的工具之一,在实际的操作中也有很多的技巧。如果要对数据分析处理的结果准确率要100%,必须要有良好的数据源,所以,在数据的处理和分析中,对数据的清洗是必不可少的,是数据分析和处理的第一步。


一、数据清洗:提取类。

函数:Left、Right、Mid、Find。

目的:按照指定的要求提取指定的值。

方法:

在指定的目标单元格中依次输入:=LEFT(C3,6)、=MID(C3,7,8)、=RIGHT(C3,4)。

解读:

除了用Left、Mid和Right提取固定位置的值之外,还可以借助Find函数提取不固定位置的值。


目的:分别提取混合内容“姓名&工号”中的“姓名”和“工号”。

方法:

在目标单元格中输入公式:=LEFT(B3,FIND("-",B3)-1)、=MID(B3,FIND("-",B3)+1,100)。

解读:

1、公式中的-1和+1是修正值,在实际的应用中要灵活对待。

2、公式:=MID(B3,FIND("-",B3)+1,100)中的第3个参数“100”是自定义值,只要明显的大于要提取字段的长度即可。


二、数据清洗:清除类。

函数:Trim。

目的:清除“员工姓名&工号”中多余的空格。

方法:

在目标单元格中输入公式:=TRIM(B3)。

解读:

1、为了更清晰的进行对比,用Len函数对清除前后的字符串长度进行了测量。

2、如果字符串中间有多个空格,则只保留一个,其余的全部会清除。


三、数据清洗:替换类。

1、Replace函数。

功能:将指定字符串中的部分字符串用新的字符串进行替换。

语法结构:=Replace(源字符串,开始位置,字符长度,替换字符串)。

目的:将“员工姓名&工号”中的“-”替换为“*”。

方法:

在目标单元格中输入公式:=REPLACE(B3,FIND("-",B3),1,"*")。


2、Substitute函数。

功能:将指定字符串中指定的字符用心的字符进行替换。

语法结构:=Substitute(源字符串,被替换字符串,替换字符串,[替换序号])。

解读:

参数“替换序号”可省略,意思就是值如果“源字符串”中有两个或多个“被替换字符串”,通过参数“替换序号”来指定具体要替换第几个“被替换字符串”。例如:字符串“我爱我的祖国”中有2个“我”,如果“替换序号”为1,则只替换第1个“我”;如果“替换序号”为2,则只替换第2个“我”。

目的:将“员工姓名&工号”中的“-”替换为“*”。

方法:

在目标单元格中输入公式:=SUBSTITUTE(B3,"-","*")。


四、数据清洗:内容合并类。

1、Concat函数。

功能:连接列表或文本字符串区域。

语法结构:=Concat(字符串或单元格区域)。

目的:将同一员工的所有信息合并到“备注”列中。

方法:

在目标单元格中输入公式:=CONCAT(B3:F3)。


2、Phonetic函数。

功能:合并出数字外的字符串或区域。

语法结构:=Phonetic(字符串或单元格区域)。

目的:将同一员工的所有信息合并到“备注”列中。

方法:

在目标单元格中输入公式:=PHONETIC(B3:F3)。

解读:

合并的内容中并没有“月薪”是因为其功能决定的,Phonetic函数不能合并没有拼音的字符。


3、Textjoin函数。

功能:使用分隔符连接列表字符串区域。

语法结构:=Textjoin(分隔符,是否保留空格,合并区域)。

目的:将同一员工的所有信息合并到“备注”列中。

方法:

在目标单元格区域中输入公式:=TEXTJOIN("、",1,B3:F3)。

解读:

上述的3个合并字符串函数,除了按列合并内容外,还可以按行合并。


最美尾巴:

工欲善其事,必先利其器,数据的处理和分析也是如此,要得到正确的结果,首先要对数据进行清洗,文中从四个方面出发,介绍了4类数据清洗技巧,包括字符提取、字符清除、字符替换以及字符连接。在实际的应用中具有很高的应用价值哦!


相关推荐

12、高阶组件:魔法增幅器——React 19 HOC模式

一、魔法增幅器的本质"高阶组件是魔法师用咒语叠加的炼金术,"霍格沃茨魔咒研究院院长凝视着发光的增幅器,"通过函数式能量场的嵌套,让基础组件获得预言家日报式的逻辑继承!"...

深入理解nodejs的异步IO与事件模块机制

一、node为什么要使用异步I/O异步最先诞生于操作系统的底层,在底层系统中,异步通过信号量、消息等方式有广泛的应用。但在大多数高级编程语言中,异步并不多见,这是因为编写异步的程序不符合人习惯的思维逻...

前端时间同步利器:React + useEffect 实现高性能动态时钟

前言在你奋笔疾敲代码的瞬间,是不是突然一低头,发现时间像偷偷跑路的变量,一眨眼就从上午飘到下午?饭没吃、会没开、工位也快被前端猫霸占了。仿佛你写的不是代码,而是“时间穿梭机”。别慌,咱们今天就来用R...

JavaScript 异步编程指南 - 聊聊 Node.js 中的事件循环

作者:五月君来源:编程界|事件循环是一种控制应用程序的运行机制,在不同的运行时环境有不同的实现,上一节讲了浏览器中的事件循环,它们有很多相似的地方,也有着各自的特点,本节讨论下Node.js中...

10个Vue开发技巧「实践」

作者:WahFung转发链接:https://juejin.im/post/5e8a9b1ae51d45470720bdfa路由参数解耦一般在组件内使用路由参数,大多数人会这样做:...

通过番计时器实例学习 React 生命周期函数 componentDidMount

大家好,今天我们将通过一个实例——番茄计时器,学习下如何使用函数生命周期的一个重要函数componentDidMount():componentDidMount(),在组件加载完成,render之后...

SRE监控四大黄金指标,任何一个有异常都会是灾难……

导读...

前端必看!10 个 Vue3 救命技巧,解决你 90% 的开发难题?

写Vue3项目时,是不是总被数据更新延迟、组件间传值混乱、页面加载缓慢这些问题折磨得头秃?别担心!作为摸爬滚打多年的老前端,今天掏出压箱底的10个实战技巧,从性能优化到复杂逻辑处理,每一个都能...

如何用2 KB代码实现3D赛车游戏?2kPlus Jam大赛了解一下

选自frankforce作者:Frank机器之心编译参与:王子嘉、GeekAI控制复杂度一直是软件开发的核心问题之一,一代代的计算机从业者纷纷贡献着自己的智慧,试图降低程序的计算复杂度。然而,将一款...

证明你访问的网站是你想访问的,Safari 真的需要

安全研究员在Safari上找到了一个新漏洞,能让网站在浏览器的地址栏内将自己伪装成另一个网站——得益于Safari地址栏的“智能缩略”功能。在Deusen最近公开的攻击演示(PoC,P...

抓狂!TS 组件性能拉胯到崩溃?4 个绝杀技巧逆风翻盘!

前端兄弟姐妹们五一假期快乐,咱们谁还没被TypeScript组件的性能问题折磨过?页面加载转圈圈,点击按钮没反应,代码改了一轮又一轮,性能却还是原地踏步,分分钟想砸电脑!别慌,今天这4个绝杀技...

让小球做圆周运动,你有几种办法?

最近在阅读外国技术文章中无意中发现了一个神奇的CSS属性motion-path,它可以让Dom元素可以按照自定义的路径移动。又想起了很久之前参加校招面试的时候,面试官问了我一个问题“能不能不借助库实现...

前端基础进阶(十四):深入核心,详解事件循环机制

EventLoopJavaScript的学习零散而庞杂,很多时候我们学到了一些东西,但是却没办法感受到进步!甚至过了不久,就把学到的东西给忘了。为了解决自己的这个困扰,在学习的过程中,我一直在试图寻...

从0搭建一个WebRTC,实现多房间多对多通话,并实现屏幕录制

这篇文章开始会实现一个一对一WebRTC和多对多的WebRTC,以及基于屏幕共享的录制。本篇会实现信令和前端部分,信令使用fastity来搭建,前端部分使用Vue3来实现。为什么要使用WebRTCWe...

Vue2 开发卡壳?这 10 个实战技巧专治各种不服

干前端开发的兄弟,谁还没被Vue2折腾过?数据不更新、组件通信乱成麻、性能差到想砸电脑……这些痛点,我都懂!今天直接甩出10个超实用的实战技巧,每一个都是从项目“血坑”里爬出来总结的,专...

取消回复欢迎 发表评论: