重学c#系列——linq(1) [二十七]

时间:2022-12-12 07:08:44

前言

简单介绍一下linq,linq很多人其实用的很熟练了,但是有些人不知道自己用的是linq。

正文

在介绍linq 之前,先介绍一下集合。

  public interface ICollection<T> : IEnumerable<T>, IEnumerable
  {
    int Count { get; }

    bool IsReadOnly { get; }

    void Add(T item);

    void Clear();

    bool Contains(T item);

    void CopyTo(T[] array, int arrayIndex);

    bool Remove(T item);
  }

什么是集合呢?在c# 中拥有上面功能的就是集合。

这里面可以看到集合继承了IEnumerable 这个接口。

继承这个接口意味集合可以列举的,也就是简单来说可以遍历的。

那么c# 中的集合是否一定要继承ICollection。

这个就不一定,比如说字典,字典在现实生活中明显是一组集合吧,那么在c# 中也应该是即可。

重学c#系列——linq(1)  [二十七]

为什么字典不继承ICollection,原因也很简单,因为void Add(T item); 对字典来说没有意义。

字典是key 和 value 这种模式,ICollection 是无法满足很多集合需求的,因为集合的多样性太多了(非常丰富)。

那么在c# 中什么样的是集合呢? 继承IEnumerable的就是集合。

如果要数据初始化的话,那么要增加Add方法。

public class TestCollection<T> : IEnumerable<T>
{
	public void Add(T a)
	{
		
	}

	public void Add(List<T> a)
	{
		
	}

	public IEnumerator<T> GetEnumerator()
	{
		throw new NotImplementedException();
	}

	IEnumerator IEnumerable.GetEnumerator()
	{
		return GetEnumerator();
	}
}

这里有两个add,一个增加T,一个增加T列表。

internal class Program
{
	static void Main(string[] args)
	{
		List<string> l = new List<string>() { "1", "2", "3"};
		TestCollection<string> a = new TestCollection<string>()
		{
			"123",
			l
		};
	}
}

这样就ok了。

我们知道实现了Ienumerable的可以进行遍历。

因为IEnumerable 返回了一个 IEnumerator GetEnumerator();。

重学c#系列——linq(1)  [二十七]

迭代器就是while,然后MoveNext,然后再Current,获取数据。

重学c#系列——linq(1)  [二十七]

这里有些人可能会有一个很小的问题,那就是为什么不直接实现迭代器,而是有一个IEnumerable,里面有一个IEnumerator GetEnumerator();。

原因很简单,因为遍历每次都是从头开始,都是一个新的开始。

因为IEnumerator 继承 IDisposable, 如果需要每次遍历完做某些事情的话,可以放在IEnumerator的void Dispose();中实现。

所以foreach 实际上是干了这样一件事。

重学c#系列——linq(1)  [二十七]

那么foreach 是否一定要继承IEnumerable 呢? 这个不一定。

foreach 采用一个duck typing的这种方式,duck typing是什么意思呢?就是走起来想一只鸭子,然后叫起来像一只鸭子,那么就是鸭子。

只要有GetEnumerator就行:

internal class Program
{
	static void Main(string[] args)
	{
		List<string> l = new List<string>() { "1", "2", "3"};
		TestForeach<string> a = new TestForeach<string>();
		foreach (var b in a)
		{
			
		}
	}
}

public class TestForeach<T> 
{
	public IEnumerator<T> GetEnumerator()
	{
		throw new NotImplementedException();
	}
}

在foreach 循环中不能进行赋值。

重学c#系列——linq(1)  [二十七]

同样在foreach 循环中不能对集合的个数进行修改。

重学c#系列——linq(1)  [二十七]

无论是增加还是删除list的version都会发生变化。

很多书里面介绍了,为什么不能复制和增加集合个数,这样会使人头脑不清醒。

因为这是遍历,应该是一个原子,这样的设计不会添加歧义性,单一职责逻辑清晰能减少不必要的bug。

一般来说都会继承一下IEnumerable 这个接口。 为什么呢?因为linq。

linq 是 language integated query,语言集成查询。

也就是说定义了一套规范哈,对于我们来说其实不用太在意这个规范是什么,大体看一下就行。

对IEnumerable而言,实现的就在system.IEnumberable.linq 上面,引用用就好。

然后linq有一个很大的特点,就是延迟执行。

然后来说下这个延迟执行是怎么实现的哈。

比如我们的list 经过where 之后,其实在运行时就不是linq。

运行时是这个类型WhereListIterator。

重学c#系列——linq(1)  [二十七]

就看个list的。

重学c#系列——linq(1)  [二十七]

执行where 其实就是把list 给 WhereListIterator。

重学c#系列——linq(1)  [二十七]

并没有生成新的list,所以说不会执行where操作。

当遍历的时候就会执行WhereListIterator的movenext。

重学c#系列——linq(1)  [二十七]

遍历的时候就会做条件判断。

所以呢,如果进行多次遍历后呢,其实一直都在执行你的where 语句。

如果需要遍历多次,where 循环后,最好直接tolist转换成一个list。

当然有兴趣可以去看下其他的,这里只是举个例子,其实就是用包装器模式实现的。

这样经过层层包装,人们就会想啊,如果where 语句按照顺序执行,那么不会很慢啊。

所以linq还可以并行实现,使用asParallel(),这个东西来实现。

重学c#系列——linq(1)  [二十七]

这样运行就是并行的, 先不管实现,并行篇会介绍,只需要知道官方帮我们实现了,这样运行更快就可以了。

因为东西比较多,下一节是一些复杂的linq和匿名linq,下下节是查询表达式。 linq 是实现其实很复杂,但是用起来是真的简单。