这篇文章将为大家详细讲解有关Java编程如何通过匹配合并数据,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
具体如下。
数据描述
以下程序是对如下格式的数据进行合并处理。
这个表的每一行表示用户id及用户的特征。其中,一个用户只有一个特征向量,即第一列不会重复。
这张表的第一列,表示用户的id,第二列表示用户所看的电影,第三列表示用户对电影的打分(1-13分),第四列表示用户对电影的打分,但分值范围是1-5分。
问题描述
在做数据预处理时,如何将第二张表添加上用户特征呢?其实,方法很简单,将第二张表的用户id与第一张表的用户id进行匹配就行。合并结果如下图所示。
数据处理程序
package deal;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.math.BigDecimal;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
/*
* author:合肥工业大学 管院学院 钱洋
* email:1563178220@qq.com
*/
public class GetPUser {
public static List<String> readDocs(String docsPath,String code) throws IOException{
BufferedReader reader = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath)),code));
String s=null;
List<String> userproductscore=new ArrayList<String>();
while ((s=reader.readLine())!=null) {
userproductscore.add(s);
}
reader.close();
return userproductscore;
}
public static HashMap<String, String> MAPread(String docsPath2,String code1) throws IOException{
BufferedReader reader1 = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath2)),code1));
String s1=null;
HashMap<String,String> userfeaturemap=new HashMap<String,String>();
while ((s1=reader1.readLine())!=null) {
String arr[]=s1.split("\t");
String feature="";
for (int i = 1; i < arr.length; i++) {
BigDecimal db = new BigDecimal(arr[i]);
String ii = db.toPlainString();
feature+=ii+" ";
}
userfeaturemap.put(s1.split("\t")[0], feature);
}
reader1.close();
return userfeaturemap;
}
public static List<String> match(List<String> userproductscore,HashMap<String, String> userfeaturemap) throws IOException{
List<String> userscoreandfeature=new ArrayList<>();
for (int i = 0; i < userproductscore.size(); i++) {
//获取用户id
String user_id=userproductscore.get(i).split("\t")[0];
//获取用户特征
String userfeature = userfeaturemap.get(user_id);
userscoreandfeature.add(userproductscore.get(i)+"\t"+userfeature);
System.out.println(userproductscore.get(i)+"\t"+userfeature);
}
return userscoreandfeature;
}
public static void main(String[] args) throws IOException {
//读取两个文本
List<String> userproductscore=readDocs("data/train/ydata-ymovies-user-movie-ratings-train-v1_0.txt","gbk");
HashMap<String, String> userfeaturemap=MAPread("data/fileofuser/yahoo.txt","utf-8");
//匹配结果
match(userproductscore,userfeaturemap);
}
}
关于“Java编程如何通过匹配合并数据”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。