【spark】java类在spark中的传递，scala object在spark中的传递

这篇具有很好参考价值的文章主要介绍了【spark】java类在spark中的传递，scala object在spark中的传递。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

记录一个比较典型的问题，先讲一下背景，有这么一个用java写的类

public class JavaClass0 implements Serializable {
	private static String name;

    public static JavaClass0 getName(String str) {
        if (name == null) {
			name=str;
		}
        return name;
    }
    ...
}

然后在spark中使用的时候：

//driver端
JavaClass0.getName("张三")//得到张三
JavaClass0.getName("李四")//得到张三

df.foreachPartition{//executor端
	m=>
	JavaClass0.getName("王五")//得到王五
	JavaClass0.getName("钱六")//得到王五
}

原因：
scala的object对应的就是java的静态成员，可以反过来理解java的所有静态成员可被抽取成伴生对象（虽然现实中是scala最终编译成java）。以上面的JavaClass0 例子可理解为等价的scala代码为：

class JavaClass0 {
  ...
}

//伴生对象
object JavaClass0 {
	private var name:String = null
	 getName(str:String) {
        if (name == null) {
			name=str
		}
        return name;
    }
}