百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

用VB.net来做powerBI分析前的数据清洗(1)

yuyutoo 2024-10-12 01:34 12 浏览 0 评论

在网上找了些powerBI数据样本来检测vb.net的数据清洗能力。

医院等级

科室

产品型号

设备系列号

是否工作站

数量

三甲

心内科

INFSP7

13400289
13400312
13400320
13400295
13400162
13400279
13400311
13400324
13400313
13400192
13201184
13201196
13201212
13201216
13400182
13400297
13400316
13400262
13400296
13400307
13400300
13600660
13600613
13600642
13600629
13600562
13600648
13600617
13600610
13600664

30

三甲

急诊科

INFSP7

13600819
13800026
13800044
13800031
13800177
13800176
13800189
13800181
13800168
13800066
13600766
13600600
13600638
13600584
13600572
13600656
13600574
13400233
13400253
13400278

20

三甲

心外科

INFSP7

13800899
13800121
13600756
13800113
13201210
13800173
13800097
13800164
13800172
13800133

10

D

ICU

VP7

15201944 15202005

2

B

ICU

VP7

14402884 11801071 15201952 15201980 15201936

5

B

ICU

VP7

12800086 15060039 15201945

3

D

ICU

SP7

13000879 13800250 13800221 13800238 13000693

5

B

普外科

SP7

12002244 12002302 12002214 12002206 12002358 13800753

6

A

心外科

SP7

13800213 13800214 13800218 13800162 13800178 13800164

6

B

神经外科

sp7

14002605.14002615.14002631.14002648.14002626.14002602

6

A

icu

sp7

14002610.14002650.14002635.14002654.14002598.14002622.14002616.14002660.14002601

9

B

儿科icu

sp7

13401218/13401022/13401172/13401014/13600961/13600969/13600963/13401159/13401199/13401214/13401206/13401226/13401201/12002331

20

第1步,先试着分割一下H2单元格

代码一:
Dim ws = (New excel).activesheet()
        Dim arr = ws.Getgrid(2, "A")
        Dim ss As String
        ss = arr(2, Abc2INT("H"))
        Dim ss2 = ss.Split(vbCrLf)
       
        Me.Text = UBound(ss2)

arr获得从A2为左上角开始的数组

ss得到H列第2行数据,也就是H2单元格数据。直接用split分离,分割符按vba vb6习惯使用vvbCrLf回车换行符。

string.split这是vbnet的新语法。

ss.Split(vbCrLf)这句在ss后面打点,直接会有语法提示。用shift+F2直接打开如上图内置帮助查看语法定义。

Public Function Split(ParamArray separator() As Char) As String()
     System.String 的成员
摘要:
返回的字符串数组包含此实例中的子字符串(由指定 Unicode 字符数组的元素分隔)。

参数:
separator: 分隔此实例中子字符串的 Unicode 字符数组、不包含分隔符的空数组或 null。

返回值:
一个数组,其元素包含此实例中的子字符串,这些子字符串由 separator 中的一个或多个字符分隔。

这是个支持一个或多个字符分隔分割字符串的函数。

回归正题:代码一得到的结果是0,也就是程序没有正确执行分割。难道分割符不是vbcrlf?

 Dim ws = (New excel).activesheet()
        Dim arr = ws.Getgrid(2, "A")
        Dim ss As String
        ss = arr(2, Abc2INT("H"))
        'Dim ss2 = ss.Split(vbCrLf)
        For i = 1 To ss.Length
            ListBox1.Items.Add(Hex(Asc(Mid(ss, i, 1))))
        Next

我在拆分前先把所有字符的ASCII码显示在listbox中,如上图清楚看到分割符是A,也就是&HA,而不是我先前以为的vbcrlf。

上图可以清楚看到 vbcrlf由两个字符组成,它们是vbcr和vblf,其对应的ascii码分别是&H0D和&H0A。

现在开始正式分割:

Dim ss2 = ss.Split(New Char() {Chr(&HA)}) 使用&HA来分割

If ss2(i) <> Chr(&HD) And ss2(i) <> Chr(&HA) And Trim(ss2(i)) <> "" Then ListBox1.Items.Add(ss2(i)) 过滤掉&hD和&hA和[空白后,结果输出到listbox中观察结果正确与否,并自动统计了listbox中的条数为30在标题栏中,结果正确。

观察下面数据,可能需要更多分割符。所以直接加上去一次性搞定:

Dim ss2 = ss.Split(New Char() {Chr(&HA), " ", ".", "/"})

直接做一个通用函数方便以后使用:

  Function split多分割符切分到list(ss As String)
        Dim ss2 = ss.Split(New Char() {Chr(&HA), " ", ".", "/"})
        Dim list As New List(Of String)
        For i = 0 To UBound(ss2)
            If ss2(i) <> Chr(&HD) And ss2(i) <> Chr(&HA) And Trim(ss2(i)) <> "" Then
                list.Add(ss2(i))
            End If
        Next
        Return list
    End Function

以上代码直接把原字符串分割成list列表,和原来的几乎完全一样,只是把输出方式改成了List(Of String)

主控代码整合测试:

excelpub.split多分割符切分到list(arr(i, 8)) 中excelpub是我自定义的模块名,使用模块名后面打一个点会自动有函数名提示,很方便,再也不会出现打错函数名的尴尬了。split放名称前便于逐级引导提示,也相当于分类了,它属于split小类

最终输出结果到sheets(3)中,通过m变量逐行下移。

结论:只要愿意造轮子,powerBI的数据清洗也可以自己做。本文只造了一个小函数,就能够处理同类复杂问题。

相关推荐

.NET 奇葩问题调试经历之3——使用了grpc通讯类库后,内存一直增长......

...

全局和隐式 using 指令详解(全局命令)

1.什么是全局和隐式using?在.NET6及更高版本中,Microsoft引入了...

请停止微服务,做好单体的模块化才是王道:Spring Modulith介绍

1、介绍模块化单体是一种架构风格,代码是根据模块的概念构成的。对于许多组织而言,模块化单体可能是一个很好的选择。它有助于保持一定程度的独立性,这有助于我们在需要的时候轻松过渡到微服务架构。Spri...

ASP.NET程序集引用之痛:版本冲突、依赖地狱等解析与实战

我是一位多年后端经验的工程师,其中前几年用ASP.NET...

.NET AOT 详解(.net 6 aot)

简介AOT(Ahead-Of-TimeCompilation)是一种将代码直接编译为机器码的技术,与传统的...

一款基于Yii2开发的免费商城系统(一款基于yii2开发的免费商城系统是什么)

哈喽,我是老鱼,一名致力于在技术道路上的终身学习者、实践者、分享者!...

asar归档解包(游戏arc文件解包)

要学习Electron逆向,首先要有一个Electron开发的程序的发布的包,这里就以其官方的electron-quick-start作为例子来进行一下逆向的过程。...

在PyCharm 中免费集成Amazon CodeWhisperer

CodeWhisperer是Amazon发布的一款免费的AI编程辅助小工具,可在你的集成开发环境(IDE)中生成实时单行或全函数代码建议,帮助你快速构建软件。简单来说,AmazonCodeWhi...

2014年最优秀JavaScript编辑器大盘点

1.WebstormWebStorm是一种轻量级的、功能强大的IDE,为Node.js复杂的客户端开发和服务器端开发提供完美的解决方案。WebStorm的智能代码编辑器支持JavaScript,...

基于springboot、tio、oauth2.0前端vuede 超轻量级聊天软件分享

项目简介:基于JS的超轻量级聊天软件。前端:vue、iview、electron实现的PC桌面版聊天程序,主要适用于私有云项目内部聊天,企业内部管理通讯等功能,主要通讯协议websocket。支持...

JetBrains Toolbox推出全新产品订阅授权模式

捷克知名软件开发公司JetBrains最为人所熟知的产品是Java编程语言开发撰写时所用的集成开发环境IntelliJIDEA,相信很多开发者都有所了解。而近期自2015年11月2日起,JetBr...

idea最新激活jetbrains-agent.jar包,亲测有效

这里分享一个2019.3.3版本的jetbrains-agent.jar,亲测有效,在网上找了很多都不能使用,终于找到一个可以使用的了,这里分享一下具体激活步骤,此方法适用于Jebrains家所有产品...

CountDownTimer的理解(countdowntomars)

CountDownTimer是android开发常用的计时类,按照注释中的说明使用方法如下:kotlin:object:CountDownTimer(30000,1000){...

反射为什么性能会很慢?(反射时为什么会越来越长)

1.背景前段时间维护一个5、6年前的项目,项目总是在某些功能使用上不尽人意,性能上总是差一些,仔细过了一下代码发现使用了不少封装好的工具类,工具类里面用了好多的反射,反射会影响到执行效率吗?盲猜了一...

btrace 开源!基于 Systrace 高性能 Trace 工具

介绍btrace(又名RheaTrace)是抖音基础技术团队自研的一款高性能AndroidTrace工具,它基于Systrace实现,并针对Systrace不足之处加以改进,核心改进...

取消回复欢迎 发表评论: